你有沒有想過,把一篇文章裡的人名、地名和關係抓出來,其實比只找人名更難?
你可以把關係抽取想成在讀文章時,不只知道誰出現了,還要知道誰跟誰有什麼關係。
它重要是因為知識圖譜、智慧客服和文件分析,都需要把文字變成可查詢的結構資料。
你可以把它想成一個把抽象概念拉回日常判斷的提示,先知道它解決什麼問題,再看技術細節。
容易混淆
關係抽取 vs 命名實體識別
關係抽取找的是實體之間的關聯 NER 找的是人名、地名、組織這些實體本身 最關鍵的區別是有沒有判斷關係。
關係抽取 vs 三元組抽取
關係抽取常專注在兩個實體的語義關係 三元組抽取會進一步整理成主詞、關係、受詞 最關鍵的區別是輸出形式是不是固定成三元組。
記住這句就好
先找出人和物,再抓出人和物之間的關係。
實際案例
知識圖譜整理 把新聞裡的「A 公司收購 B 公司」抽成結構化資料後,系統就能查出誰收購了誰。
合約審查 把合約中的「甲方委託乙方」抓出來後,法務就能更快比對責任關係。
算法與應用
常見流程是先做 NER,再做關係分類,最後把關係寫回資料庫或知識圖譜。 模型可以用規則、傳統分類器或 Transformer,差別在於對上下文的理解深度。 資料標註很吃重,因為同一句話可能有多種關係,標準要先定清楚。
情境判斷
Q1(直覺題): 句子裡先標出「台積電」和「張忠謀」,這一步比較像什麼?
Q2(判斷題): 如果句子裡有兩個人名,但沒有明確寫出兩人關係,能不能硬抽?
常見問題
關係抽取一定要先做 NER 嗎?
A:通常會先做 NER,因為先知道實體是誰,後面才比較好判斷它們之間的關係。
關係抽取常用什麼指標?
A:常看精確率、召回率和 F1,因為它既要找得到關係,也要少誤判。
怎麼提升關係抽取效果?
A:除了更好的模型,也要靠更乾淨的標註資料和更清楚的關係定義。