RE（關係抽取）是什麼？完整定義與解說

你有沒有想過，把一篇文章裡的人名、地名和關係抓出來，其實比只找人名更難？

你可以把關係抽取想成在讀文章時，不只知道誰出現了，還要知道誰跟誰有什麼關係。

它重要是因為知識圖譜、智慧客服和文件分析，都需要把文字變成可查詢的結構資料。

你可以把它想成一個把抽象概念拉回日常判斷的提示，先知道它解決什麼問題，再看技術細節。

容易混淆

關係抽取 vs 命名實體識別

關係抽取找的是實體之間的關聯 NER 找的是人名、地名、組織這些實體本身最關鍵的區別是有沒有判斷關係。

關係抽取 vs 三元組抽取

關係抽取常專注在兩個實體的語義關係三元組抽取會進一步整理成主詞、關係、受詞最關鍵的區別是輸出形式是不是固定成三元組。

記住這句就好

先找出人和物，再抓出人和物之間的關係。

實際案例

知識圖譜整理 把新聞裡的「A 公司收購 B 公司」抽成結構化資料後，系統就能查出誰收購了誰。

合約審查 把合約中的「甲方委託乙方」抓出來後，法務就能更快比對責任關係。

算法與應用

常見流程是先做 NER，再做關係分類，最後把關係寫回資料庫或知識圖譜。模型可以用規則、傳統分類器或 Transformer，差別在於對上下文的理解深度。資料標註很吃重，因為同一句話可能有多種關係，標準要先定清楚。

情境判斷

Q1（直覺題）： 句子裡先標出「台積電」和「張忠謀」，這一步比較像什麼？

這比較像命名實體識別，還沒進到關係抽取。

Q2（判斷題）： 如果句子裡有兩個人名，但沒有明確寫出兩人關係，能不能硬抽？

不能硬抽，最好標成未知或無關係，因為關係抽取要的是可證明的語義關聯，不是猜測。

常見問題

關係抽取一定要先做 NER 嗎？

A：通常會先做 NER，因為先知道實體是誰，後面才比較好判斷它們之間的關係。

關係抽取常用什麼指標？

A：常看精確率、召回率和 F1，因為它既要找得到關係，也要少誤判。

怎麼提升關係抽取效果？

A：除了更好的模型，也要靠更乾淨的標註資料和更清楚的關係定義。

容易混淆

記住這句就好

實際案例

算法與應用

情境判斷

常見問題

相關術語

延伸學習

資料來源與參考依據