RAG（檢索增強生成）是什麼？完整定義與解說

iPAS 高頻生成式AI自然語言處理

你問 AI 一個公司制度問題時，會不會希望它先去查資料，再回答你？

你可以把 RAG 想成先翻書再作答的助理，先找資料，再把資料整理成答案。

它重要是因為大模型不一定記得最新資訊，RAG 可以把外部知識接進來，減少幻覺。

你可以把它想成一個把抽象概念拉回日常判斷的提示，先知道它解決什麼問題，再看技術細節。

容易混淆

RAG vs Fine-tuning

RAG 是回答時先檢索再生成 Fine-tuning 是先把模型參數訓練成特定風格或能力最關鍵的區別是外部知識放在哪裡。

RAG vs 一般搜尋

RAG 會把查到的內容再用模型整理成完整回答一般搜尋只把相關文件列給你看最關鍵的區別是有沒有生成能力。

記住這句就好

先查再答，RAG 才比較不會胡說。

實際案例

企業客服 員工問報銷規則時，系統先從內部文件檢索，再用 LLM 整理成易懂回答。

法規問答 當法規更新很快時，RAG 可以先抓最新條文，再產出較準確的摘要。

算法與應用

典型流程是問題向量化、檢索候選、重排序、把片段塞進提示詞再生成。 RAG 的價值不只在答得像人，更在於能把答案和來源一起帶出來。如果檢索品質差，生成再強也會答歪，所以檢索層很重要。

情境判斷

Q1（直覺題）： 模型回答前先去內部知識庫找資料，再整合成答案，這是什麼？

這就是 RAG。

Q2（判斷題）： RAG 既然會檢索外部知識，還會不會答錯？

還是會。只要檢索到錯資料、片段切分不好或上下文放錯，答案就可能偏掉。

iPAS 考題

Q：iPAS 常怎麼考 RAG？ A：常考它的流程、跟 Fine-tuning 的差別，以及它如何降低幻覺。

常見問題

RAG 是什麼？

A：就是先檢索外部資料，再把資料交給模型生成答案。

RAG 和 Fine-tuning 差在哪？

A：RAG 改的是回答流程，Fine-tuning 改的是模型參數。

RAG 怎麼減少 AI 幻覺？

A：因為模型有機會依據外部來源作答，不必只靠自己記憶。

RAG 適合哪些場景？

A：適合文件多、知識常更新、而且需要可追溯來源的場景。

範例考題

某企業建置基於檢索增強生成（RAG）的法遵知識輔助系統，用於整合法規條文、內控制度與歷史函釋文件。系統運行後發現，每當法規更新或新增解釋文件時，需重新建立完整索引，導致更新期間系統暫停服務，且部分回應偶有引用舊版內容的情形。若希望在兼顧查詢效率的同時提升知識更新彈性與系統穩定性，下列何者最適合？

A. 提升模型推論資源配置，以維持高流量查詢時的回應效能
B. 調整語言模型的輸出限制機制，以降低生成內容與法規不一致的風險
C. 建立固定法規問答對照表，以規則化方式優先回應常見問題
D. 導入可支援增量更新的索引管理方式，使異動文件可即時反映於檢索結果 ✓ 正確答案

解析：

問題的核心是每次更新需重建完整索引導致服務中斷和引用舊版內容。導入增量更新的索引管理方式，讓新增或修改的文件可以即時更新到索引中，無需重建完整索引，既解決服務中斷又解決舊版引用問題。

某企業建置檢索增強生成（Retrieval-augmented generation, RAG）系統支援內部知識查詢。隨著使用量提升，團隊發現模型回覆品質穩定，但推論延遲與運算成本逐漸增加。專案規劃在維持回覆品質前提下進行效能優化。在此情境下，若採用知識蒸餾（Knowledge Distillation），下列敘述何者最為合理？

A. 將檢索資料轉換為結構化規則以取代模型
B. 僅透過增加檢索文件數量改善效能
C. 停用生成模型以避免延遲問題
D. 使小型模型學習大型模型行為，以降低推論成本 ✓ 正確答案

解析：

知識蒸餾是讓小型模型（學生模型）學習大型模型（教師模型）的行為與輸出，從而在維持品質的前提下降低推論延遲與運算成本。

檢索增強生成（Retrieval-Augmented Generation）是什麼？

容易混淆

記住這句就好

實際案例

算法與應用

情境判斷

iPAS 考題

常見問題

範例考題

立即測驗

容易混淆

記住這句就好

實際案例

算法與應用

情境判斷

iPAS 考題

常見問題

相關術語

範例考題

延伸學習

立即測驗

資料來源與參考依據