你有沒有遇過 AI 明明很會聊天,卻看不懂你公司的文件? 你可以把 LlamaIndex 想成,替大模型把資料整理好、排好、送進來的中介層。 它其實就是連接 LLM 和私有資料的資料框架。 當你想做知識庫問答、文件搜尋或 RAG,它就很常派上用場。
容易混淆
LlamaIndex vs LangChain LlamaIndex 更偏資料索引與檢索,LangChain 更像通用工具箱。 一個重資料,一個重流程組裝。
LlamaIndex vs 向量資料庫 向量資料庫負責存和查,LlamaIndex 負責把資料切好、索引好、串好。 一個是底層倉庫,一個是資料調度員。
最關鍵的區別: 索引框架和資料庫不是同一層。
記住這句就好
先把資料整理好,大模型才答得像樣。
實際案例
公司知識庫問答 把政策、SOP、會議紀錄切成可檢索單位後,員工就能問自然語言問題。
客服文件搜尋 客服人員想找退貨條款時,不用翻整份手冊,系統先找出最相關段落再交給模型整理。
算法與應用
常見流程是切塊、建立索引、檢索相關片段,再把片段交給 LLM 生成答案。 它的重點不在模型本身,而在資料進來後怎麼被整理、連結和查回來。 對企業內部知識、法規、手冊和長文件很實用。
情境判斷
Q1(直覺題): 你要讓模型讀公司文件後回答問題,最需要處理的是什麼?
Q2(判斷題): 如果資料本來就很少,還需要 LlamaIndex 嗎?
常見問題
LlamaIndex 跟 LangChain 可以一起用嗎?
可以,很多專案會把 LlamaIndex 負責資料側,LangChain 負責流程側。
LlamaIndex 一定要搭向量資料庫嗎?
不一定,但搭配向量資料庫通常能讓檢索更有效率。
LlamaIndex 適合哪種資料?
適合文件、手冊、知識庫、FAQ 這種需要檢索的非結構化資料。