iPAS AI 應用規劃師 初級 科目一 人工智慧基礎概論

RAG 系統怎麼讓知識庫隨時更新?

原題 42

某企業建置基於檢索增強生成(RAG)的法務知識輔助系統,用於整合法規條文、內控制度與歷史函釋文件。系統運行後發現,每當法規更新或新增解釋文件時,需重新建立完整索引,導致更新期間系統暫停服務,且部分回應有引用舊版內容的情形。若希望在兼顧查詢效率的同時提升知識更新彈性與系統穩定性,下列何者最適合?

白話

一家企業建置了 RAG 法務知識輔助系統,整合了法規條文、內控制度和歷史函釋文件。每當法規更新或新增解釋文件時,系統必須重新建立完整索引,導致更新期間停止服務,而且部分回應還會引用到舊版內容。

問你:若希望在兼顧查詢效率的同時,提升知識更新彈性與系統穩定性,哪個做法最適合?

點選你的答案。

01 總結

一句話總結

RAG 系統的知識更新問題,根本原因在索引架構,導入增量更新的索引管理方式,讓新文件即時進索引而不需重建整套,才能兼顧效率與彈性

02 情境

先感受問題:法規天天更新,系統卻得停機

想像你是「安誠法律科技」的 AI 系統負責人。公司開發了一套 RAG 法務助理,給企業法務人員查詢法規。系統串接三種文件:公司法修正條文、金融監理函釋、內部合規制度。

每隔幾週,金管會就會更新一批函釋,公司法也可能修正。你的系統每次遇到文件更新,就要把整個向量索引從頭重建,耗時 3 小時,這段時間系統無法查詢。更糟的是,重建期間剛好有人查到舊版函釋,給出了錯誤的法律建議。

法務人員反應:「為什麼昨天查出來的規定,跟今天的不一樣?」你的問題很清楚:索引更新機制太笨重,每次都要全部重來。

03 對照

「全量重建索引」方式的五個痛點

  1. 更新期間停機:重建索引需要時間,這段期間系統無法回應查詢,影響業務連續性
  2. 舊版內容殘留:重建前仍服務中的查詢,可能拿到已被廢止的舊版文件內容
  3. 資源浪費:只有 5% 的文件更新,卻要把 100% 的文件重新向量化,計算資源全部浪費
  4. 更新頻率受限:因為重建成本太高,只能定期批次更新,無法做到即時反映
  5. 版本管理困難:全量重建時,新舊版本的切換邊界不明確,容易出現「一半新一半舊」的混亂狀態

「安誠法律科技」的工程師每次法規更新都要在半夜執行重建腳本,第二天還要人工驗證結果,已經疲憊不堪。

04 解法

增量索引管理怎麼解

「安誠法律科技」導入增量更新(Incremental Indexing)架構後,做法變成這樣:

只處理異動的文件:金管會更新了 3 份函釋,系統只對這 3 份重新做向量化並更新索引,其他 997 份文件不動。整個過程在背景執行,不影響前台查詢服務。

版本標記隔離:每份文件都有版本標籤,新版本進索引後,舊版本被標記為「已廢止」,查詢時系統自動只撈有效版本,不再回傳廢止內容。

索引分層設計:基礎索引(不常變動的法規骨架)與動態索引(頻繁更新的函釋)分開管理,查詢時合併結果。這樣就算動態部分在更新,基礎部分照常提供服務。

結果:更新時間從 3 小時降到 15 分鐘,系統全程不停機,法務人員查到的永遠是最新有效版本。

這就是選項 D 講的:導入可支援增量更新的索引管理方式,使異動文件可即時反映於檢索結果

技術版:RAG 索引架構在 AI 系統中的位置

RAG(Retrieval-Augmented Generation,檢索增強生成)是目前企業 AI 應用最主流的架構之一,屬於「生成式 AI + 知識庫」的整合模式。核心流程是:使用者提問 → 向量搜尋相關文件片段 → 把文件片段塞進語言模型的提示中 → 語言模型生成有根據的回答。

索引(Index)在 RAG 中的角色:RAG 的知識來自向量資料庫(Vector Database),文件被切成小段(Chunk)後轉換成向量,存入索引。查詢時,用戶問題也被轉成向量,搜尋距離最近的文件片段。索引的品質決定了 RAG 能不能找到對的資料。

增量更新 vs. 全量重建:全量重建是把所有文件重新向量化並寫入索引,適合初次建立。增量更新只對「有異動的文件」操作,其他文件的向量不動。這個差別在大型知識庫中影響極大:10 萬份文件只更新 100 份,就不應該花時間處理其他 99,900 份。

實務上誰在用:法律科技、醫療法規查詢、企業內部政策助理、金融合規系統,這些場景都有「文件頻繁更新」的特性,是 RAG 增量索引最典型的應用場景。

為什麼出題者要考這題:AI 應用規劃師在設計 RAG 系統時,必須考慮「知識更新機制」,而不只是「模型有多厲害」。這題在測試應試者能不能從系統架構層面思考問題,而非只想到加資源或調模型。

05 陷阱

為什麼其他選項是錯的

A提升模型推論資源配置,以維持高流量查詢時的回應效能

字面在說什麼

加更多 CPU/GPU 或記憶體給模型,讓同時有很多人查詢時速度不會變慢。

為什麼不對

題目的問題是「更新文件時停機」和「引用舊版內容」,這是索引架構問題,不是計算資源不夠的問題。加資源解決不了停機和舊版殘留,只能讓查詢跑得快一點。

誰會選錯

看到「效能」「高流量」就聯想到「加資源」的人。要先讀清楚題目描述的是哪種效能問題:是延遲(latency)還是更新(update)的問題。

B調整語言模型的輸出限制機制,以降低生成內容與法規不一致的風險

字面在說什麼

限制語言模型的回答範圍或加護欄(guardrail),防止它生成跟法規有出入的內容。

為什麼不對

引用舊版內容的問題不是因為模型「胡說」,而是因為索引裡還存著舊版文件,模型忠實引用了舊索引的內容。限制輸出無法改變索引裡的文件,根本問題沒解決。

誰會選錯

把「引用舊版內容」誤解成「模型幻覺(hallucination)」的人。兩者完全不同:幻覺是模型自己編造,舊版引用是模型老實讀了過時的索引文件。

C建立固定法規問答對照表,以規則化方式優先回應常見問題

字面在說什麼

把常見問題和答案預先寫成固定的 FAQ 表,查詢時先比對這張表,有就直接回答。

為什麼不對

固定對照表正好是「更新彈性最差」的做法。法規一更新,對照表裡的所有答案都要人工重寫,維護成本比重建索引還高。題目要的是「提升更新彈性」,固定表是反方向。

誰會選錯

直覺認為「把答案寫死比較穩定可靠」的人。在快速變動的法規環境下,寫死答案是風險最高的做法,因為維護頻率跟不上法規更新速度。

06 變形

同個考點下次怎麼變形

變形 1

RAG 系統出現「幻覺(Hallucination)」跟「引用舊版文件」,根本原因有什麼不同?

直覺

兩種都是「答錯了」,但成因完全不同,解法也不同。

答案

幻覺是語言模型在知識庫找不到答案時自己編造內容,解法是改善檢索精準度或加護欄。引用舊版文件是索引裡存著已廢止的版本,模型忠實地引用了,解法是索引的版本管理與增量更新機制。

變形 2

向量資料庫在 RAG 系統中扮演什麼角色?

直覺

聽說 RAG 需要向量資料庫,但不清楚為什麼不用普通資料庫。

答案

向量資料庫存的是文件的數學表示(向量),查詢時計算語意相似度,能找到「意思相近」的文件,而不只是文字完全一樣的文件。普通資料庫做關鍵字比對,找不到「同義說法」,語意搜尋能力差很多。

變形 3

企業知識庫文件頻繁更新,RAG 系統規劃時最優先考量的架構特性是什麼?

直覺

應該是找一個功能最強的語言模型?

答案

最優先是索引的更新機制,也就是能否支援增量更新、版本隔離、不停機更新。語言模型再強,如果知識庫裡的文件是舊的,答案還是錯的。RAG 的品質瓶頸通常在資料管線,不在模型本身。

變形 4

RAG 與傳統微調(Fine-tuning)在「知識更新」這件事上,哪個更有優勢?

直覺

微調是把知識直接「燒進」模型,感覺比較根本?

答案

知識更新這件事 RAG 有很大優勢。微調要更新知識,就要重新訓練模型,成本高、時間長,知識截止日期很固定。RAG 只要更新向量資料庫裡的文件,語言模型不需要重訓,幾分鐘就能反映最新知識。

變形 5

RAG 系統提升查詢品質,下列哪個方向最直接有效?

直覺

換更大的語言模型?

答案

最直接的是改善「檢索(Retrieval)」那一步:優化文件分塊策略(Chunking)、改善向量化模型的語意理解能力、或加入重排序(Re-ranking)篩選最相關的文件片段。語言模型換大的效果有限,因為它的輸出品質受限於送進去的文件片段品質。

07 延伸

想再往下看,這 5 個

出處

iPAS 經濟部產業人才能力鑑定 ・ 115 年第一次 iPAS AI 應用規劃師 初級 科目一 人工智慧基礎概論 第 42 題

查看官方原文 PDF