可解釋人工智慧(Explainable AI)是什麼?

可解釋 AI 透過視覺化或簡化模型,讓複雜的黑箱模型預測決策過程能被人類理解、信任與稽核。|本頁含完整原理、應用場景、iPAS 考試重點與 3 個常見問答。

可解釋人工智慧(Explainable AI)是什麼? iPAS AI倫理與治理模型評估

AI 給你一個結果時,你是不是也想知道它為什麼這樣判斷? 你可以把可解釋人工智慧想成,幫黑箱模型補上一層人看得懂的理由。 它其實就是用視覺化、特徵重要性、局部近似或規則化的方法,讓人能理解模型為什麼做出這個決策。

你可以把它想成一個把抽象概念拉回日常判斷的提示,先知道它解決什麼問題,再看技術細節。

容易混淆

可解釋 AI vs 黑箱模型 黑箱模型只給結果,不說原因,可解釋 AI 則盡量把理由攤開。

可解釋 AI vs 公平性 可解釋 AI 是看懂模型怎麼想,公平性是看模型有沒有系統性偏見,兩者相關但不相同。

可解釋性 vs 可視化 可視化只是表現形式之一,可解釋性還包括規則、反事實和局部代理模型。

最關鍵的區別: 你想知道的是「它怎麼判斷」,還是「它有沒有偏袒某些人」。

記住這句就好

看懂模型理由,才知道能不能信它。

實際案例

案例一:貸款審核 系統拒絕你的申請時,如果能指出是收入、負債比還是信用紀錄影響最大,使用者和審核人員都比較能接受。

案例二:醫療影像輔助 模型說某張 X 光片有異常時,若能標出可疑區域和關鍵特徵,醫師就能更快判斷是不是要進一步檢查。

深入了解

常見方法包括 LIME、SHAP、特徵重要性、注意力可視化和反事實解釋。LIME 會在單一案例附近建立局部近似模型,SHAP 會用貢獻分配的方式說明每個特徵影響了多少。可解釋 AI 的重點不是把模型變簡單,而是讓複雜模型的決策能被檢查、質疑和修正。

情境判斷

Q1(直覺題): 你要讓業務同事知道模型為什麼拒絕某個客戶,這時候是不是該加可解釋 AI?

→ 是,因為你需要的不只是結果,還要一個人看得懂的理由。

Q2(判斷題): 如果模型本來就很簡單,像線性回歸,還需不需要特別做可解釋 AI?

→ 看情況。簡單模型本身就比較容易解釋,但如果你要做稽核、法遵或對外溝通,還是可能需要更明確的解釋輸出。

iPAS 考題

Q1: 可解釋人工智慧最主要的目的之一是什麼? (A) 讓模型變得更深 (B) 讓模型決策更容易被人理解與稽核 (C) 讓訓練資料自動標註 (D) 讓損失函數自動消失

→ (B)。可解釋 AI 的核心就是把黑箱決策變成可理解、可檢查的資訊。

Q2: 下列哪一種方法最常被用來解釋單一預測案例? (A) LIME (B) K-means (C) Batch Normalization (D) Dropout

→ (A)。LIME 很常拿來做單一樣本的局部解釋。

常見問題

可解釋人工智慧和模型可解釋性有什麼不同?

模型可解釋性偏向模型本身容易被理解,可解釋 AI 則包含一整套把黑箱結果變成人能看懂的方法。

什麼時候應該使用可解釋人工智慧?

當決策會影響金錢、健康、法律或信任時,就很值得加上解釋層。

初學者學習可解釋人工智慧最常見的誤解是什麼?

很多人以為有了注意力熱圖就等於完成解釋,其實那只是其中一種訊號,不能單獨當成完整答案。

範例考題

在可解釋 AI(Explainable AI, XAI)的分類架構中,LIME(Local Interpretable Model-agnostic Explanations)屬於哪一類解釋技術?

  • A. 內建可解釋模型(Intrinsic Interpretability):模型本身具有透明的決策結構
  • B. 對話式解釋系統(Conversational AI Explainer):透過互動對話提供模型解釋
  • C. 後處理模型解釋(post-hoc):對已訓練模型提供外部解釋 ✓ 正確答案
  • D. 代理模型技術(Surrogate Model):訓練另一個簡單模型來完全取代原黑盒模型進行推論

解析:

LIME 是一種後處理(post-hoc)解釋技術,它不改變原始模型,而是在模型訓練完成後,透過局部近似的方式對已訓練模型的預測結果提供解釋。它與模型本身的結構無關(model-agnostic)。

立即測驗

想測試你對 可解釋人工智慧 的掌握程度? 開始模擬考