分塊處理 是什麼?

Chunking — 分塊處理 的完整解釋

分塊處理是指將大型資料集或文本分割成更小、更易於管理的部分,以便於模型處理和分析,提升效率。

容易混淆

分塊處理 vs 斷詞 分塊處理是把長內容切段,斷詞是把文字切成 token 或詞。

分塊處理 vs 批次處理 分塊處理是在內容上切段,批次處理是在計算流程上分批送入。

分塊處理 vs 完整輸入 完整輸入一次吃完,分塊處理則是拆開後逐段處理。

記住這句就好

先看它要解決的是什麼問題,再看它是不是最合適的方法。

實際案例

案例 1:長 PDF 摘要 把文件切成可讀的小段,模型才有機會逐段理解。

案例 2:RAG 檢索 切塊後每塊更容易被檢索命中,也比較好放進上下文。

深入了解

面向 重點
核心 把長內容切成可處理的單位,避免上下文和記憶體超載。
做法 常會加重疊、加入標題資訊,讓切段不會太碎。
注意 切太小會失去上下文,切太大又會塞爆模型。

情境判斷

Q1(判斷題): 一篇超長報告要丟給模型,先分塊通常會更好嗎? → 通常會,因為模型更容易逐段處理。

Q2(判斷題): 分塊越小就越好嗎? → 不是,太小會把關鍵上下文切散。

相關術語

常見問題

chunk size 要怎麼選?

要看模型上下文長度、任務需求和資料結構。

可以重疊切塊嗎?

可以,而且常常很有幫助,因為它能保留跨段資訊。

分塊後一定要做摘要嗎?

不一定,但摘要或標題化通常能提升檢索和理解效果。