語義搜尋(Semantic Search)是什麼?

語義搜尋是一種理解使用者搜尋意圖和上下文的搜尋技術,超越了關鍵字匹配,旨在提供更相關和精確的搜尋結果。|本頁含完整原理、應用場景、iPAS 考試重點與 3 個常見問答。

語義搜尋(Semantic Search)是什麼? 自然語言處理知識圖譜

你有沒有在你想找「那篇講台股 AI 應用的文章」,但記不得標題,只記得內容大意,發現只看表面常常不夠?

你可以把它想成先理解你想找什麼,再去找意思接近的資料,不只比對字面。

關鍵字很容易漏掉同義詞和改寫內容,語義搜尋能把意思相近的文件撈出來。

容易混淆

關鍵字搜尋 關鍵字搜尋像在書架上找書名完全符合的,語義搜尋像理解你的問題後,推薦內容相關但書名不一定完全一樣的書。

最關鍵的區別:先看它是在比意思、比結構,還是在做任務輸出。

記住這句就好

記不得原字,也能找到意思相近的結果,就是語義搜尋。

實際案例

學生搜尋「怎麼讓模型回答更準」,系統可能找到「RAG」、「向量資料庫」、「檢索增強生成」這些文章。 企業知識庫查詢「請問報銷流程」,即使文件寫的是「費用申請」,也應該被找出來。

算法與應用

常見流程是把查詢和文件轉成 embedding,再丟進向量資料庫或混合搜尋系統比對相似度。 實務上常會搭配 rerank,先撈候選結果,再用更精準的模型重排。

情境判斷

Q1(直覺題): 你輸入「AI 寫報告」,系統找到「自動摘要」文件,這算對嗎?

→ 算。語義搜尋看的是意思相近,不是字串完全一樣。

Q2(判斷題): 如果所有結果都只因為關鍵字命中而出現,這還是語義搜尋嗎?

→ 不完全是。那比較像關鍵字搜尋,語義搜尋通常要有語意表示和相似度比對。

常見問題

語義搜尋如何處理同義詞和多義詞?

語義搜尋通過使用知識圖譜和向量嵌入來處理同義詞和多義詞。知識圖譜可以提供關於字詞之間關係的資訊,例如同義詞和上位詞。向量嵌入可以將字詞表示為高維空間中的向量,使得同義詞的向量更加接近,而多義詞的向量則根據上下文的不同而有所變化。例如,對於「蘋果」這個詞,知識圖譜可以指出它既可以指水果,也可以指蘋果公司。向量嵌入可以根據上下文的不同,將「蘋果」表示為不同的向量,以便區分其不同的含義。

語義搜尋如何處理長尾查詢?

長尾查詢是指那些搜尋頻率很低的查詢。語義搜尋可以通過使用知識擴展和向量嵌入來處理長尾查詢。知識擴展可以利用知識圖譜或其他知識來源,擴展使用者查詢的範圍,從而找到與查詢相關的資訊。向量嵌入可以將長尾查詢表示為高維空間中的向量,使得與查詢相關的文檔的向量更加接近,即使這些文檔中沒有包含查詢中的關鍵字。例如,如果使用者查詢「台北哪裡可以吃到好吃的牛肉麵」,語義搜尋可以利用知識圖譜擴展到台北的牛肉麵店,並使用向量嵌入找到與查詢相關的食記和評價。

語義搜尋的未來發展趨勢是什麼?

語義搜尋的未來發展會更重視上下文理解、跨來源知識整合、個人化結果和推理能力,也會更自然地結合語音與視覺搜尋。