iPAS AI 應用規劃師初級　科目二　生成式 AI 應用與規劃

Chunking 機制的主要目的是什麼？

原題 13

某企業建置文件型知識查詢系統，將大量長篇內部文件轉換為可供生成式 AI 使用的知識來源。在測試過程中，團隊發現若直接以整份文件進行檢索，模型回覆常包含無關內容，且引用段落不夠精準。團隊評估後，決定導入 Chunking 機制的主要目的為何？

白話

某企業建置文件型知識查詢系統，把大量長篇內部文件轉換為 AI 可用的知識來源。測試時發現，直接用整份文件進行檢索，模型回覆常包含無關內容，且引用段落不夠精準。團隊評估後決定導入 Chunking 機制。

問你：導入 Chunking 機制的主要目的是什麼？

點選你的答案。

← 回 50 題列表回 iPAS 備考總覽

01　總結

一句話總結

Chunking 把長文件切成小段落，讓搜尋結果更精準對齊問題的語意，並排除整份長文件帶入的無關雜訊，不是為了省記憶體或加速推論。

02　情境

先感受問題：把整本書餵給 AI，它找不到你要的那句話

假設你是「安心保險」公司的 AI 系統導入負責人，老闆要你建一個讓客服人員問問題、AI 從公司理賠手冊回答的系統。

你把「理賠作業規範 v5.2」整份 PDF（共 120 頁）存進知識庫。客服同仁問：「骨折手術有沒有涵蓋在住院理賠裡？」結果 AI 回答的是：「本公司提供多種保障方案，依據保戶需求……（以下五百字廢話）」，根本沒有直接回答骨折手術的條款。

問題出在哪？搜尋器在整份 120 頁文件裡找「最相關的段落」，找出來的是整份文件的摘要頁，而不是「第 47 頁第 3 條手術理賠條款」。整份文件太長，搜尋的精準度就大幅下降，AI 拿到的是一大包混雜的文字，回覆品質當然差。

03　對照

不做 Chunking，直接用整份文件，有哪些問題

搜尋精準度低：整份文件作為一個搜尋單元，向量嵌入是整份文件的「平均語意」，跟問題對齊的程度遠低於聚焦一個主題的小段落
回覆含大量無關內容：AI 拿到整份文件，不知道哪段才是問題需要的，往往把全部都摘要進來，回答又長又不精準
引用段落不準：回覆說「來源是第三章」，但第三章有三十頁，使用者根本找不到具體是哪條規定
Token 限制的壓力：把整份長文件塞進提示詞，很快就會超過模型的輸入長度上限（context window），導致系統無法運作
跨文件查詢更難：當知識庫有幾百份文件，整份搜尋更難區分「哪份文件的哪個段落」才是最相關的

04　解法

Chunking 怎麼解決這個問題

「安心保險」的工程師把 120 頁理賠手冊按段落切開，每個 chunk 大約 300-500 字，聚焦一個條款或一個概念。「手術理賠條款第 3 條」就是一個獨立的 chunk。

切塊之後，搜尋的效果完全不同。客服問「骨折手術有沒有涵蓋在住院理賠裡？」，搜尋器在幾千個小 chunk 裡找語意最接近的，直接命中「第 47 頁第 3 條手術理賠條款（300 字）」這個 chunk，精準地把這 300 字附在提示詞裡給 AI。

AI 讀了聚焦在手術理賠的 300 字，直接回答：「骨折手術符合住院手術項目，理賠範圍為實際醫療費用的 80%，上限 50 萬元……」清楚、有根據、不廢話。

Chunking 讓「搜尋出來的段落」跟「使用者的問題」在語意上高度對齊，同時把無關的內容擋在門外。

這就是選項 B 講的：提升檢索結果的語意對齊程度，並降低長文件帶來的干擾。

技術版：Chunking 在 RAG 系統中的位置與策略

Chunking 在 RAG 流程中的位置：RAG 系統建立知識庫的流程通常是：原始文件 → Chunking（切塊）→ 向量嵌入（Embedding）→ 存入向量資料庫。Chunking 是第一步，決定了後續所有步驟的搜尋精準度。切得好，整個系統就精準；切得不好，後面再多優化也效果有限。

常見的 Chunking 策略：

固定大小切塊：每 N 個 token 切一塊，最簡單但可能切在句子中間
依段落/章節切塊：按照文件的自然段落結構切，語意完整性更好
滑動窗口（Sliding Window）：相鄰 chunk 有重疊，避免重要資訊剛好落在切割邊界上
語意切塊：用 NLP 模型判斷語意邊界，切在主題轉換處

Chunk 大小的取捨：切太小，每個 chunk 缺乏上下文，語意不完整；切太大，等於沒切，搜尋精準度低。通常 300-1000 token 是常見範圍，需要根據實際文件類型調整。

為什麼出題者要考這題：Chunking 是 RAG 系統建置的核心決策之一，AI 應用規劃師在規劃知識型 AI 系統時必須理解這個概念，才能跟工程師溝通、評估系統品質問題的根因。

05　陷阱

為什麼其他選項是錯的

A透過縮短輸入長度，加速模型推理流程

字面在說什麼

Chunking 把長文件切短，所以輸入給模型的文字變短了，模型跑得更快。

為什麼不對

Chunking 確實會讓每個搜尋單元變短，但主要目的不是加速，而是提升搜尋精準度。而且加速推論不是 RAG 系統設計的核心目標，題目問的是為什麼「導入 Chunking」，情境明確描述問題是「回覆包含無關內容、引用不精準」，跟速度無關。

誰會選錯

知道 Chunking 會把文件切短，就以為「縮短輸入 = 加速」是主要目的的人。把副作用當成主目的選了。

C減少模型執行時的記憶體使用量，以提升系統穩定性

字面在說什麼

把文件切小，塞進模型的文字少了，模型用的記憶體就少了，系統比較不會當機。

為什麼不對

記憶體使用量和系統穩定性不是 Chunking 解決的核心問題。Chunking 的本質是優化「搜尋到的段落跟問題的相關程度」，不是為了系統資源管理。題目描述的問題是「回覆不精準」，不是「系統崩潰」。

誰會選錯

從「工程系統優化」角度思考的人，以為切小文件的主要效益是省資源。這是把技術手段（輸入變小）對應到錯誤的效益（省記憶體）。

D讓模型在生成回覆時具備更高的創意發揮空間

字面在說什麼

文件切短了，模型輸入的約束少了，可以更「自由創意」地生成回答。

為什麼不對

「創意發揮」這個說法根本不是知識查詢系統的目標，完全相反。知識查詢系統要的是回答精準、有依據，不是要 AI 發揮創意。Chunking 的目的是提升「精準度」，讓 AI 說出有根據的話，而不是鼓勵 AI 自由發揮。

誰會選錯

對「生成式 AI」的印象停留在「創意生成」的人。這是混淆了生成式 AI 的創意應用場景和知識查詢系統的精準回覆場景。

06　變形

同個考點下次怎麼變形

變形 1

RAG 系統中，如果回覆品質很差（答非所問），首先應該檢查哪個環節？

直覺

品質差是模型的問題嗎？還是資料的問題？

答案

首先檢查「檢索品質」，也就是搜尋出來的 chunk 是否跟問題相關。如果搜尋出來的段落就不對，再好的生成模型也沒辦法回答正確。Chunking 策略（切塊大小和方式）是影響檢索品質的核心變因。

變形 2

Chunking 切太小和切太大各有什麼問題？

直覺

切越小越精準？還是切太小也有問題？

答案

切太小：每個 chunk 缺乏上下文，語意不完整，AI 拿到的資訊片段不足以回答完整問題。切太大：每個 chunk 包含太多不同主題，搜尋精準度低，等於沒有解決原本的問題。最佳大小取決於文件類型，通常需要實驗調整。

變形 3

「語意對齊（Semantic Alignment）」在 RAG 中是什麼意思？

直覺

語意對齊聽起來很學術，實際上指什麼？

答案

語意對齊是指「搜尋到的段落」和「使用者問題」在意思上的相符程度。問「骨折手術理賠」，找到「手術費用條款」就是高度語意對齊；找到「保費繳納說明」就是語意不對齊。Chunking 把文件切成聚焦單一主題的小塊，每個 chunk 的語意更純粹，和特定問題的對齊程度就更高。

變形 4

除了 Chunking，還有哪些方式可以提升 RAG 系統的回覆精準度？

直覺

如果 Chunking 還不夠，還能怎麼優化？

答案

常見做法包括：改善 Embedding 模型（讓語意向量更精準）、加入 Re-ranking（對搜尋結果二次排序）、使用 Metadata 過濾（加上文件來源、日期、類別的標籤）、使用 Hybrid Search（結合語意搜尋和關鍵字搜尋）。Chunking 是基礎，上述是進階優化。

變形 5

「幻覺（Hallucination）」問題和 Chunking 品質有什麼關係？

直覺

AI 說出不存在的資訊，跟切塊方式有關係嗎？

答案

有關係。當 Chunking 品質差（切塊太大或不精準），搜尋出來的段落跟問題語意不對齊，AI 拿到不相關的資料，就更容易「自行補充」不存在的資訊（幻覺）。好的 Chunking 讓 AI 有精準的知識來源，可以有效降低幻覺發生率。

07　延伸

想再往下看，這 5 個

Chunking（切塊）將長文件切成較小的語意單元，讓 RAG 系統的搜尋步驟能找到更精準、語意更聚焦的段落
向量嵌入（Embedding）將文字轉換成數字向量以捕捉語意，是 RAG 系統做語意搜尋的基礎，Chunking 後每個 chunk 都會被轉成向量
語意搜尋（Semantic Search）根據語意相似度而非關鍵字比對搜尋文件，能找到意思相近但用詞不同的段落
幻覺（Hallucination）AI 模型生成不存在或不正確的資訊，RAG 系統透過提供有根據的知識來源來降低這個問題
Context Window（上下文視窗）語言模型能一次處理的最大 token 數量，Chunking 的大小設計需要在 Context Window 限制範圍內規劃