AS（摘要生成技術）是什麼？完整定義與解說

自然語言處理深度學習

你有沒有讀過一篇超長的報告，然後試著用自己的話跟別人說重點？

摘要生成技術就是讓 AI 做同樣的事：讀完一篇文章後，用全新的句子把重點重新表達出來，而不是直接從原文剪貼句子。這跟傳統的「提取式摘要」不同，提取式摘要只是從原文挑出重要的句子排在一起，生成式摘要則是真正理解內容後重新寫一段話。

為什麼這很重要？因為人類寫摘要時不會直接複製貼上，而是消化理解後用更精練的方式表達。AI 要做到這件事，需要真正「懂」原文在講什麼。

就像先用生活中的例子抓住核心用途，再回頭看名詞和公式，理解會穩很多。

容易混淆

摘要生成（Abstractive）vs 提取式摘要（Extractive）vs 文本改寫（Paraphrasing）

摘要生成：理解原文後用新句子重寫重點，可能包含原文沒有的詞彙。

提取式摘要：直接從原文挑選最重要的句子，不改動任何文字。

文本改寫：把一句話用不同方式重新表達，但不做濃縮或提煉重點。

最關鍵的區別：摘要生成是「理解後重寫」，提取式摘要是「複製貼上」，改寫只是換說法但不縮短。

記住這句就好

不是剪貼原文，是讀懂之後用自己的話講重點。

實際案例

新聞摘要自動化

Google News 用摘要生成技術自動為新聞文章產生簡短摘要，讓用戶在不點進去的情況下就能掌握重點。這不是從文章裡挑一句話出來，而是重新組織語言，把一篇 2000 字的報導濃縮成 3 句話。

法律文件摘要

一家法律科技公司用摘要生成技術處理合約文件，原本律師花 2 小時讀完一份 50 頁合約的時間，縮短到 10 分鐘看完 AI 生成的摘要。準確率達到 89%，但仍然需要人工審核關鍵條款。

深入了解

摘要生成的技術演進

方法做什麼限制

Seq2Seq + Attention 用編碼器-解碼器架構，注意力機制讓模型聚焦重點長文本容易丟失資訊

Pointer-Generator 結合生成新詞和從原文複製的能力仍然會產生重複內容

Transformer 用自注意力機制平行處理整篇文章計算成本高

預訓練模型（BART、T5）在大量文本上預訓練後微調可能產生事實錯誤

LLM（GPT-4、Claude）零樣本或少樣本就能生成高品質摘要可能出現幻覺

方法	做什麼	限制
Seq2Seq + Attention	用編碼器-解碼器架構，注意力機制讓模型聚焦重點	長文本容易丟失資訊
Pointer-Generator	結合生成新詞和從原文複製的能力	仍然會產生重複內容
Transformer	用自注意力機制平行處理整篇文章	計算成本高
預訓練模型（BART、T5）	在大量文本上預訓練後微調	可能產生事實錯誤
LLM（GPT-4、Claude）	零樣本或少樣本就能生成高品質摘要	可能出現幻覺

情境判斷

Q1（直覺題）： 你需要快速瀏覽 100 篇論文找出相關的那幾篇，你應該用提取式摘要還是生成式摘要？

→ 提取式摘要更適合。因為提取式摘要直接用原文句子，不會產生事實錯誤，篩選階段你需要的是準確而非精練。

Q2（判斷題）： 你用生成式摘要幫客戶自動生成會議紀錄，客戶抱怨有些重點被「改寫」後意思變了。你應該換成提取式摘要，還是改善生成模型？

→ 看情境。如果會議紀錄需要高度準確（如法律、醫療場景），換成提取式摘要更安全。如果只是一般商業會議，改善模型並加上人工審核是更好的做法，因為提取式摘要的可讀性通常較差。

常見問題

生成式摘要會不會「編造」原文沒有的內容？

會，這是最大的風險，叫做「幻覺」。模型可能會生成聽起來很合理但原文並沒有提到的資訊。目前的做法是用事實一致性檢查工具（如 FactCC）來偵測這類問題。

怎麼評估摘要生成的品質？

常用的自動指標有 ROUGE（比較生成摘要和參考摘要的重疊程度）和 BERTScore（用語義相似度評估）。但最可靠的還是人工評估，看摘要是否準確、完整、流暢。

摘要生成可以處理多長的文本？

取決於模型的上下文窗口。早期模型只能處理幾百字，現在的大型語言模型可以處理數萬字。超過上下文窗口的文本需要先分段摘要再整合。

容易混淆

記住這句就好

實際案例

深入了解

情境判斷

常見問題

相關術語

延伸學習

資料來源與參考依據