解析:
問題的核心是每次更新需重建完整索引導致服務中斷和引用舊版內容。導入增量更新的索引管理方式,讓新增或修改的文件可以即時更新到索引中,無需重建完整索引,既解決服務中斷又解決舊版引用問題。
RAG(檢索增強生成)讓 AI 回答問題前先查詢外部知識庫,再結合查到的資料生成答案,大幅減少幻覺、提升回答準確性。|本頁含完整原理、應用場景、iPAS 考試重點與 4 個常見問答。
你問 AI 一個公司制度問題時,會不會希望它先去查資料,再回答你?
你可以把 RAG 想成先翻書再作答的助理,先找資料,再把資料整理成答案。
它重要是因為大模型不一定記得最新資訊,RAG 可以把外部知識接進來,減少幻覺。
你可以把它想成一個把抽象概念拉回日常判斷的提示,先知道它解決什麼問題,再看技術細節。
RAG vs Fine-tuning
RAG 是回答時先檢索再生成 Fine-tuning 是先把模型參數訓練成特定風格或能力 最關鍵的區別是外部知識放在哪裡。
RAG vs 一般搜尋
RAG 會把查到的內容再用模型整理成完整回答 一般搜尋只把相關文件列給你看 最關鍵的區別是有沒有生成能力。
先查再答,RAG 才比較不會胡說。
企業客服 員工問報銷規則時,系統先從內部文件檢索,再用 LLM 整理成易懂回答。
法規問答 當法規更新很快時,RAG 可以先抓最新條文,再產出較準確的摘要。
典型流程是問題向量化、檢索候選、重排序、把片段塞進提示詞再生成。 RAG 的價值不只在答得像人,更在於能把答案和來源一起帶出來。 如果檢索品質差,生成再強也會答歪,所以檢索層很重要。
Q1(直覺題): 模型回答前先去內部知識庫找資料,再整合成答案,這是什麼?
Q2(判斷題): RAG 既然會檢索外部知識,還會不會答錯?
Q:iPAS 常怎麼考 RAG? A:常考它的流程、跟 Fine-tuning 的差別,以及它如何降低幻覺。
A:就是先檢索外部資料,再把資料交給模型生成答案。
A:RAG 改的是回答流程,Fine-tuning 改的是模型參數。
A:因為模型有機會依據外部來源作答,不必只靠自己記憶。
A:適合文件多、知識常更新、而且需要可追溯來源的場景。
某企業建置基於檢索增強生成(RAG)的法遵知識輔助系統,用於整合法規條文、內控制度與歷史函釋文件。系統運行後發現,每當法規更新或新增解釋文件時,需重新建立完整索引,導致更新期間系統暫停服務,且部分回應偶有引用舊版內容的情形。若希望在兼顧查詢效率的同時提升知識更新彈性與系統穩定性,下列何者最適合?
解析:
問題的核心是每次更新需重建完整索引導致服務中斷和引用舊版內容。導入增量更新的索引管理方式,讓新增或修改的文件可以即時更新到索引中,無需重建完整索引,既解決服務中斷又解決舊版引用問題。
某企業建置檢索增強生成(Retrieval-augmented generation, RAG)系統支援內部知識查詢。隨著使用量提升,團隊發現模型回覆品質穩定,但推論延遲與運算成本逐漸增加。專案規劃在維持回覆品質前提下進行效能優化。在此情境下,若採用知識蒸餾(Knowledge Distillation),下列敘述何者最為合理?
解析:
知識蒸餾是讓小型模型(學生模型)學習大型模型(教師模型)的行為與輸出,從而在維持品質的前提下降低推論延遲與運算成本。
想測試你對 檢索增強生成 的掌握程度? 開始模擬考