iPAS AI 應用規劃師初級　科目一　人工智慧基礎概論

RAG 系統怎麼讓知識庫隨時更新？

原題 42

某企業建置基於檢索增強生成（RAG）的法務知識輔助系統，用於整合法規條文、內控制度與歷史函釋文件。系統運行後發現，每當法規更新或新增解釋文件時，需重新建立完整索引，導致更新期間系統暫停服務，且部分回應有引用舊版內容的情形。若希望在兼顧查詢效率的同時提升知識更新彈性與系統穩定性，下列何者最適合？

白話

一家企業建置了 RAG 法務知識輔助系統，整合了法規條文、內控制度和歷史函釋文件。每當法規更新或新增解釋文件時，系統必須重新建立完整索引，導致更新期間停止服務，而且部分回應還會引用到舊版內容。

問你：若希望在兼顧查詢效率的同時，提升知識更新彈性與系統穩定性，哪個做法最適合？

點選你的答案。

← 回 50 題列表回 iPAS 備考總覽

01　總結

一句話總結

RAG 系統的知識更新問題，根本原因在索引架構，導入增量更新的索引管理方式，讓新文件即時進索引而不需重建整套，才能兼顧效率與彈性。

02　情境

先感受問題：法規天天更新，系統卻得停機

想像你是「安誠法律科技」的 AI 系統負責人。公司開發了一套 RAG 法務助理，給企業法務人員查詢法規。系統串接三種文件：公司法修正條文、金融監理函釋、內部合規制度。

每隔幾週，金管會就會更新一批函釋，公司法也可能修正。你的系統每次遇到文件更新，就要把整個向量索引從頭重建，耗時 3 小時，這段時間系統無法查詢。更糟的是，重建期間剛好有人查到舊版函釋，給出了錯誤的法律建議。

法務人員反應：「為什麼昨天查出來的規定，跟今天的不一樣？」你的問題很清楚：索引更新機制太笨重，每次都要全部重來。

03　對照

「全量重建索引」方式的五個痛點

更新期間停機：重建索引需要時間，這段期間系統無法回應查詢，影響業務連續性
舊版內容殘留：重建前仍服務中的查詢，可能拿到已被廢止的舊版文件內容
資源浪費：只有 5% 的文件更新，卻要把 100% 的文件重新向量化，計算資源全部浪費
更新頻率受限：因為重建成本太高，只能定期批次更新，無法做到即時反映
版本管理困難：全量重建時，新舊版本的切換邊界不明確，容易出現「一半新一半舊」的混亂狀態

「安誠法律科技」的工程師每次法規更新都要在半夜執行重建腳本，第二天還要人工驗證結果，已經疲憊不堪。

04　解法

增量索引管理怎麼解

「安誠法律科技」導入增量更新（Incremental Indexing）架構後，做法變成這樣：

只處理異動的文件：金管會更新了 3 份函釋，系統只對這 3 份重新做向量化並更新索引，其他 997 份文件不動。整個過程在背景執行，不影響前台查詢服務。

版本標記隔離：每份文件都有版本標籤，新版本進索引後，舊版本被標記為「已廢止」，查詢時系統自動只撈有效版本，不再回傳廢止內容。

索引分層設計：基礎索引（不常變動的法規骨架）與動態索引（頻繁更新的函釋）分開管理，查詢時合併結果。這樣就算動態部分在更新，基礎部分照常提供服務。

結果：更新時間從 3 小時降到 15 分鐘，系統全程不停機，法務人員查到的永遠是最新有效版本。

這就是選項 D 講的：導入可支援增量更新的索引管理方式，使異動文件可即時反映於檢索結果。

技術版：RAG 索引架構在 AI 系統中的位置

RAG（Retrieval-Augmented Generation，檢索增強生成）是目前企業 AI 應用最主流的架構之一，屬於「生成式 AI + 知識庫」的整合模式。核心流程是：使用者提問 → 向量搜尋相關文件片段 → 把文件片段塞進語言模型的提示中 → 語言模型生成有根據的回答。

索引（Index）在 RAG 中的角色：RAG 的知識來自向量資料庫（Vector Database），文件被切成小段（Chunk）後轉換成向量，存入索引。查詢時，用戶問題也被轉成向量，搜尋距離最近的文件片段。索引的品質決定了 RAG 能不能找到對的資料。

增量更新 vs. 全量重建：全量重建是把所有文件重新向量化並寫入索引，適合初次建立。增量更新只對「有異動的文件」操作，其他文件的向量不動。這個差別在大型知識庫中影響極大：10 萬份文件只更新 100 份，就不應該花時間處理其他 99,900 份。

實務上誰在用：法律科技、醫療法規查詢、企業內部政策助理、金融合規系統，這些場景都有「文件頻繁更新」的特性，是 RAG 增量索引最典型的應用場景。

為什麼出題者要考這題：AI 應用規劃師在設計 RAG 系統時，必須考慮「知識更新機制」，而不只是「模型有多厲害」。這題在測試應試者能不能從系統架構層面思考問題，而非只想到加資源或調模型。

05　陷阱

為什麼其他選項是錯的

A提升模型推論資源配置，以維持高流量查詢時的回應效能

字面在說什麼

加更多 CPU/GPU 或記憶體給模型，讓同時有很多人查詢時速度不會變慢。

為什麼不對

題目的問題是「更新文件時停機」和「引用舊版內容」，這是索引架構問題，不是計算資源不夠的問題。加資源解決不了停機和舊版殘留，只能讓查詢跑得快一點。

誰會選錯

看到「效能」「高流量」就聯想到「加資源」的人。要先讀清楚題目描述的是哪種效能問題：是延遲（latency）還是更新（update）的問題。

B調整語言模型的輸出限制機制，以降低生成內容與法規不一致的風險

字面在說什麼

限制語言模型的回答範圍或加護欄（guardrail），防止它生成跟法規有出入的內容。

為什麼不對

引用舊版內容的問題不是因為模型「胡說」，而是因為索引裡還存著舊版文件，模型忠實引用了舊索引的內容。限制輸出無法改變索引裡的文件，根本問題沒解決。

誰會選錯

把「引用舊版內容」誤解成「模型幻覺（hallucination）」的人。兩者完全不同：幻覺是模型自己編造，舊版引用是模型老實讀了過時的索引文件。

C建立固定法規問答對照表，以規則化方式優先回應常見問題

字面在說什麼

把常見問題和答案預先寫成固定的 FAQ 表，查詢時先比對這張表，有就直接回答。

為什麼不對

固定對照表正好是「更新彈性最差」的做法。法規一更新，對照表裡的所有答案都要人工重寫，維護成本比重建索引還高。題目要的是「提升更新彈性」，固定表是反方向。

檢索增強生成（Retrieval-Augmented Generation）先從知識庫檢索相關文件再生成回答的架構，本題情境核心，知識更新問題根源在索引管理方式
向量資料庫（Vector Database）RAG 系統儲存文件語意向量的引擎，增量更新的實現載體，支援即時新增向量而無需重建全部索引
分塊處理（Chunking）將長文件切成片段分別向量化，增量更新時只需處理異動文件的分塊，不影響其他已建立的索引
AI 幻覺（Hallucination）引用舊版法規的情形屬於幻覺的一種表現，RAG 知識庫未即時更新是觸發幻覺的主因
嵌入表示（Embedding）將文件轉換為高維向量的過程，增量更新時新文件需重新 Embedding 後才能加入索引進行語意搜尋