混合搜尋(Hybrid Search)是什麼?

混合搜尋結合了多種搜尋技術,例如關鍵字搜尋和語義搜尋,以提高搜尋結果的相關性和準確性,提供更全面的資訊。|本頁含完整原理、應用場景、iPAS 考試重點與 3 個常見問答。

混合搜尋(Hybrid Search)是什麼? 自然語言處理推薦系統

你有沒有搜尋過資料庫,明明字很像卻找不到,或字不一樣卻其實很相關?

你可以把混合搜尋想成把關鍵字搜尋和語意搜尋一起用。 它同時抓精準字詞和語意相近的內容,所以比單用一種方法更不容易漏答案。

你可以把它想成一個把抽象概念拉回日常判斷的提示,先知道它解決什麼問題,再看技術細節。

容易混淆

混合搜尋 vs 語義搜尋 語義搜尋主要看意義相近 混合搜尋還會保留關鍵字匹配 最關鍵的區別是單看語意,還是語意加字面

混合搜尋 vs 向量搜尋 向量搜尋主要靠 embedding 相似度 混合搜尋會再加上詞項匹配 最關鍵的區別是只看向量,還是向量和詞一起看

記住這句就好

關鍵字和語意一起找。

實際案例

企業知識庫 員工可能會打出產品型號、法規條文或縮寫,混合搜尋能提高把答案找回來的機率。

客服搜尋 使用者有時會照著系統詞彙查,也有時會用白話問,混合搜尋比較不容易漏掉。

算法與應用

實務上常先做兩路檢索,再把結果合併或重排。 它特別適合資料很多、問法很多樣,且不能漏答案的場景。

情境判斷

Q1: 使用者打的是產品代碼,這時還只靠語意搜尋夠嗎? → 通常不夠,混合搜尋可以保住精準字詞匹配。

Q2: 使用者問法很口語,沒有固定名詞,混合搜尋還有用嗎? → 有,因為語意路徑能補上白話表達。

常見問題

混合搜尋一定要兩套索引嗎?

通常是,但實作方式可以很彈性。

它是為了提高召回還是精確率?

兩者都可能改善,但最常見是先提高召回,再靠重排拉精準。

什麼場景最值得用?

文件多、問法雜、又不能漏重要資訊時最值得。