你有沒有讀過一篇超長的報告,然後試著用自己的話跟別人說重點?
摘要生成技術就是讓 AI 做同樣的事:讀完一篇文章後,用全新的句子把重點重新表達出來,而不是直接從原文剪貼句子。這跟傳統的「提取式摘要」不同,提取式摘要只是從原文挑出重要的句子排在一起,生成式摘要則是真正理解內容後重新寫一段話。
為什麼這很重要?因為人類寫摘要時不會直接複製貼上,而是消化理解後用更精練的方式表達。AI 要做到這件事,需要真正「懂」原文在講什麼。
就像先用生活中的例子抓住核心用途,再回頭看名詞和公式,理解會穩很多。
容易混淆
摘要生成(Abstractive)vs 提取式摘要(Extractive)vs 文本改寫(Paraphrasing)
摘要生成:理解原文後用新句子重寫重點,可能包含原文沒有的詞彙。
提取式摘要:直接從原文挑選最重要的句子,不改動任何文字。
文本改寫:把一句話用不同方式重新表達,但不做濃縮或提煉重點。
最關鍵的區別:摘要生成是「理解後重寫」,提取式摘要是「複製貼上」,改寫只是換說法但不縮短。
記住這句就好
不是剪貼原文,是讀懂之後用自己的話講重點。
實際案例
新聞摘要自動化
Google News 用摘要生成技術自動為新聞文章產生簡短摘要,讓用戶在不點進去的情況下就能掌握重點。這不是從文章裡挑一句話出來,而是重新組織語言,把一篇 2000 字的報導濃縮成 3 句話。
法律文件摘要
一家法律科技公司用摘要生成技術處理合約文件,原本律師花 2 小時讀完一份 50 頁合約的時間,縮短到 10 分鐘看完 AI 生成的摘要。準確率達到 89%,但仍然需要人工審核關鍵條款。
深入了解
摘要生成的技術演進
方法 做什麼 限制 Seq2Seq + Attention 用編碼器-解碼器架構,注意力機制讓模型聚焦重點 長文本容易丟失資訊 Pointer-Generator 結合生成新詞和從原文複製的能力 仍然會產生重複內容 Transformer 用自注意力機制平行處理整篇文章 計算成本高 預訓練模型(BART、T5) 在大量文本上預訓練後微調 可能產生事實錯誤 LLM(GPT-4、Claude) 零樣本或少樣本就能生成高品質摘要 可能出現幻覺
情境判斷
Q1(直覺題): 你需要快速瀏覽 100 篇論文找出相關的那幾篇,你應該用提取式摘要還是生成式摘要?
→ 提取式摘要更適合。因為提取式摘要直接用原文句子,不會產生事實錯誤,篩選階段你需要的是準確而非精練。
Q2(判斷題): 你用生成式摘要幫客戶自動生成會議紀錄,客戶抱怨有些重點被「改寫」後意思變了。你應該換成提取式摘要,還是改善生成模型?
→ 看情境。如果會議紀錄需要高度準確(如法律、醫療場景),換成提取式摘要更安全。如果只是一般商業會議,改善模型並加上人工審核是更好的做法,因為提取式摘要的可讀性通常較差。
常見問題
生成式摘要會不會「編造」原文沒有的內容?
會,這是最大的風險,叫做「幻覺」。模型可能會生成聽起來很合理但原文並沒有提到的資訊。目前的做法是用事實一致性檢查工具(如 FactCC)來偵測這類問題。
怎麼評估摘要生成的品質?
常用的自動指標有 ROUGE(比較生成摘要和參考摘要的重疊程度)和 BERTScore(用語義相似度評估)。但最可靠的還是人工評估,看摘要是否準確、完整、流暢。
摘要生成可以處理多長的文本?
取決於模型的上下文窗口。早期模型只能處理幾百字,現在的大型語言模型可以處理數萬字。超過上下文窗口的文本需要先分段摘要再整合。