向量資料庫 是什麼?
Vector Database — 向量資料庫 的完整解釋
向量資料庫是一種專門儲存和檢索向量嵌入的資料庫,能高效處理高維度資料的相似性搜尋,廣泛應用於推薦系統和語義搜尋。
容易混淆
向量資料庫 vs 關聯式資料庫 向量資料庫靠相似度找資料 關聯式資料庫靠欄位和條件查資料 最關鍵的區別:意思相近還是欄位精準
向量資料庫 vs 搜尋引擎 向量資料庫重視語意距離 搜尋引擎更常做關鍵字和排序 最關鍵的區別:語意搜尋和字面搜尋
向量資料庫 vs 嵌入模型 向量資料庫負責存和找 嵌入模型負責把內容轉成向量 最關鍵的區別:儲存檢索和表示生成
記住這句就好
先把內容變向量,再用距離找出最像的那一群。
實際案例
客服知識庫 把 FAQ 轉成向量後,使用者即使換成別的說法,系統也能找出相近答案
圖片推薦 商品圖片編碼成向量後,可以用外觀相似度找出相似商品
算法與應用
| 嵌入表示 | 把內容轉成向量 | 是前置步驟 | | 相似度搜尋 | 找距離最近的向量 | 常用餘弦或內積 | | 索引結構 | 加速大量向量查找 | 不然查詢太慢 | | RAG | 把檢索內容送進生成模型 | 很常見的組合 |
情境判斷
Q1(直覺題):你要找意思相近的 FAQ,向量資料庫有幫助嗎? → 有幫助,因為它不只看關鍵字,還看語意相似度。
Q2(判斷題):你要做精準欄位篩選,例如價格大於 1000,還適合只靠它嗎? → 不適合,這種條件查詢關聯式資料庫更直接。
相關術語
常見問題
向量資料庫一定要搭配大模型嗎?
不一定,但通常會先靠嵌入模型產生向量。
它只能放文字嗎?
不是,圖片、音訊和影片特徵都可以。
為什麼查得快很重要?
因為向量資料常常很大,沒有索引就會慢到不能用。