概念瓶頸模型 是什麼?
Concept Bottleneck Model — 概念瓶頸模型 的完整解釋
概念瓶頸模型是一種深度學習模型,它強制模型通過人類可理解的概念來進行預測,從而提高模型的可解釋性和可控性。
容易混淆
概念瓶頸模型 vs 黑箱模型 vs 注意力可視化
概念瓶頸模型:先預測可理解的概念,再由概念做最後輸出
黑箱模型:直接給結果,你不容易知道中間怎麼想
注意力可視化:只能幫你看模型關注哪裡,不等於真的把推理過程拆開
最關鍵的區別:概念瓶頸模型是真正把「中間概念」放進模型流程。
記住這句就好
先讓 AI 說清楚概念,再讓它下判斷。
實際案例
醫療判讀
前:模型直接說有沒有肺炎,但醫師看不到原因
後:先輸出影像裡是否有浸潤、陰影、腫塊等概念,再綜合判斷
產品審核
前:系統只告訴你商品合不合規,卻不說哪裡有問題
後:先標示出疑似違規成分、圖像元素或描述詞,再給最終結果
算法與應用
這類模型通常會把原始資料先映射到一組人類可理解的概念,再用這些概念做預測
它常出現在可解釋人工智慧、醫療影像、風險審查和合規判斷等場景
缺點是要先定義好概念,若概念本身不好量化,模型就會卡在瓶頸上
情境判斷
Q1(直覺題): 如果你想知道 AI 為什麼判定一張圖有問題,概念瓶頸模型有幫助嗎?
→ 有幫助,因為它會先輸出可理解的中間概念,再給最後答案。
Q2(判斷題): 只要模型有注意力熱圖,就等於是概念瓶頸模型嗎?
→ 不是。注意力熱圖只是顯示關注位置,沒有把概念變成模型流程中的必經關卡。
相關術語
常見問題
概念瓶頸模型一定比較準嗎?
不一定,它常用可解釋性換取一部分彈性。
概念要誰來定義?
通常要由領域專家和模型設計者一起定義,否則概念可能不完整。
它適合哪些場景?
最適合需要審核原因、需要可追溯判斷的場景,例如醫療、金融和內容審查。