---
title: "摘要生成技術（Abstractive Summarization）"
slug: abstractive-summarization
language: zh-TW
source: https://aiterms.tw/terms/abstractive-summarization
updated_at: 2026-04-29
tags: [自然語言處理, 深度學習, 生成式AI, 模型訓練, 大型語言模型, 神經網路, AI應用]
ipas_term: false
---

# 摘要生成技術（Abstractive Summarization）

> **你有沒有讀過一篇超長的報告，然後試著用自己的話跟別人說重點？**
>
> 摘要生成技術就是讓 AI 做同樣的事：讀完一篇文章後，用全新的句子把重點重新表達出來，而不是直接從原文剪貼句子。這跟傳統的「提取式摘要」不同，提取式摘要只是從原文挑出重要的句子排在一起，生成式摘要則是真正理解內容後重新寫一段話。
>
> 為什麼這很重要？因為人類寫摘要時不會直接複製貼上，而是消化理解後用更精練的方式表達。AI 要做到這件事，需要真正「懂」原文在講什麼。
>
> 就像先用生活中的例子抓住核心用途，再回頭看名詞和公式，理解會穩很多。

### 容易混淆

> **摘要生成（Abstractive）vs 提取式摘要（Extractive）vs 文本改寫（Paraphrasing）**
>
> 摘要生成：理解原文後用新句子重寫重點，可能包含原文沒有的詞彙。
>
> 提取式摘要：直接從原文挑選最重要的句子，不改動任何文字。
>
> 文本改寫：把一句話用不同方式重新表達，但不做濃縮或提煉重點。
>
> 最關鍵的區別：摘要生成是「理解後重寫」，提取式摘要是「複製貼上」，改寫只是換說法但不縮短。

### 記住這句就好

> 不是剪貼原文，是讀懂之後用自己的話講重點。

### 實際案例

> **新聞摘要自動化**
>
> Google News 用摘要生成技術自動為新聞文章產生簡短摘要，讓用戶在不點進去的情況下就能掌握重點。這不是從文章裡挑一句話出來，而是重新組織語言，把一篇 2000 字的報導濃縮成 3 句話。
>
> **法律文件摘要**
>
> 一家法律科技公司用摘要生成技術處理合約文件，原本律師花 2 小時讀完一份 50 頁合約的時間，縮短到 10 分鐘看完 AI 生成的摘要。準確率達到 89%，但仍然需要人工審核關鍵條款。

### 深入了解

> **摘要生成的技術演進**
>
> | 方法 | 做什麼 | 限制 |
> |---|---|---|
> | Seq2Seq + Attention | 用編碼器-解碼器架構，注意力機制讓模型聚焦重點 | 長文本容易丟失資訊 |
> | Pointer-Generator | 結合生成新詞和從原文複製的能力 | 仍然會產生重複內容 |
> | Transformer | 用自注意力機制平行處理整篇文章 | 計算成本高 |
> | 預訓練模型（BART、T5） | 在大量文本上預訓練後微調 | 可能產生事實錯誤 |
> | LLM（GPT-4、Claude） | 零樣本或少樣本就能生成高品質摘要 | 可能出現幻覺 |

### 情境判斷

> **Q1（直覺題）：** 你需要快速瀏覽 100 篇論文找出相關的那幾篇，你應該用提取式摘要還是生成式摘要？
>
> → 提取式摘要更適合。因為提取式摘要直接用原文句子，不會產生事實錯誤，篩選階段你需要的是準確而非精練。
>
> **Q2（判斷題）：** 你用生成式摘要幫客戶自動生成會議紀錄，客戶抱怨有些重點被「改寫」後意思變了。你應該換成提取式摘要，還是改善生成模型？
>
> → 看情境。如果會議紀錄需要高度準確（如法律、醫療場景），換成提取式摘要更安全。如果只是一般商業會議，改善模型並加上人工審核是更好的做法，因為提取式摘要的可讀性通常較差。

### 常見問題

> **Q：生成式摘要會不會「編造」原文沒有的內容？**
> 會，這是最大的風險，叫做「幻覺」。模型可能會生成聽起來很合理但原文並沒有提到的資訊。目前的做法是用事實一致性檢查工具（如 FactCC）來偵測這類問題。
>
> **Q：怎麼評估摘要生成的品質？**
> 常用的自動指標有 ROUGE（比較生成摘要和參考摘要的重疊程度）和 BERTScore（用語義相似度評估）。但最可靠的還是人工評估，看摘要是否準確、完整、流暢。
>
> **Q：摘要生成可以處理多長的文本？**
> 取決於模型的上下文窗口。早期模型只能處理幾百字，現在的大型語言模型可以處理數萬字。超過上下文窗口的文本需要先分段摘要再整合。

### 相關術語

> - **提取式摘要技術**：摘要生成的對照方法，直接挑原文句子，了解兩者差異才能選對工具
> - **自然語言生成**：摘要生成是自然語言生成的一個具體應用
> - **語言模型**：摘要生成的核心技術基礎
> - **Seq2Seq**：早期摘要生成最常用的模型架構
> - **ROUGE評分**：評估摘要品質的標準指標

---

來源：https://aiterms.tw/terms/abstractive-summarization
快查頁：https://aiterms.tw/terms/abstractive-summarization
最後更新：2026/04/29
深度解說：https://aiterms.tw/learning/what-is-abstractive-summarization