分塊處理 是什麼?
Chunking — 分塊處理 的完整解釋
分塊處理是指將大型資料集或文本分割成更小、更易於管理的部分,以便於模型處理和分析,提升效率。
容易混淆
分塊處理 vs 斷詞 分塊處理是把長內容切段,斷詞是把文字切成 token 或詞。
分塊處理 vs 批次處理 分塊處理是在內容上切段,批次處理是在計算流程上分批送入。
分塊處理 vs 完整輸入 完整輸入一次吃完,分塊處理則是拆開後逐段處理。
記住這句就好
先看它要解決的是什麼問題,再看它是不是最合適的方法。
實際案例
案例 1:長 PDF 摘要 把文件切成可讀的小段,模型才有機會逐段理解。
案例 2:RAG 檢索 切塊後每塊更容易被檢索命中,也比較好放進上下文。
深入了解
面向 重點 核心 把長內容切成可處理的單位,避免上下文和記憶體超載。 做法 常會加重疊、加入標題資訊,讓切段不會太碎。 注意 切太小會失去上下文,切太大又會塞爆模型。
情境判斷
Q1(判斷題): 一篇超長報告要丟給模型,先分塊通常會更好嗎? → 通常會,因為模型更容易逐段處理。
Q2(判斷題): 分塊越小就越好嗎? → 不是,太小會把關鍵上下文切散。
相關術語
常見問題
chunk size 要怎麼選?
要看模型上下文長度、任務需求和資料結構。
可以重疊切塊嗎?
可以,而且常常很有幫助,因為它能保留跨段資訊。
分塊後一定要做摘要嗎?
不一定,但摘要或標題化通常能提升檢索和理解效果。