羊駝索引 是什麼?
LlamaIndex — 羊駝索引 的完整解釋
LlamaIndex是一個資料框架,用於連接大型語言模型(LLMs)與您的私有或特定領域的資料,簡化建立基於LLM的應用程式。
容易混淆
LlamaIndex vs LangChain LlamaIndex 更偏資料索引與檢索,LangChain 更像通用工具箱。 一個重資料,一個重流程組裝。
LlamaIndex vs 向量資料庫 向量資料庫負責存和查,LlamaIndex 負責把資料切好、索引好、串好。 一個是底層倉庫,一個是資料調度員。
最關鍵的區別: 索引框架和資料庫不是同一層。
記住這句就好
先把資料整理好,大模型才答得像樣。
實際案例
公司知識庫問答 把政策、SOP、會議紀錄切成可檢索單位後,員工就能問自然語言問題。
客服文件搜尋 客服人員想找退貨條款時,不用翻整份手冊,系統先找出最相關段落再交給模型整理。
算法與應用
常見流程是切塊、建立索引、檢索相關片段,再把片段交給 LLM 生成答案。 它的重點不在模型本身,而在資料進來後怎麼被整理、連結和查回來。 對企業內部知識、法規、手冊和長文件很實用。
情境判斷
Q1(直覺題): 你要讓模型讀公司文件後回答問題,最需要處理的是什麼?
→ 先把文件切塊、索引和檢索做好,這正是 LlamaIndex 擅長的事。
Q2(判斷題): 如果資料本來就很少,還需要 LlamaIndex 嗎?
→ 看情況,資料少時可以簡化流程,但只要要做可查詢知識庫,索引設計仍然有價值。
相關術語
常見問題
LlamaIndex 跟 LangChain 可以一起用嗎?
可以,很多專案會把 LlamaIndex 負責資料側,LangChain 負責流程側。
LlamaIndex 一定要搭向量資料庫嗎?
不一定,但搭配向量資料庫通常能讓檢索更有效率。
LlamaIndex 適合哪種資料?
適合文件、手冊、知識庫、FAQ 這種需要檢索的非結構化資料。