iPAS AI 應用規劃師初級　科目二　生成式 AI 應用與規劃

偏見檢測 vs 偏見緩解，差在哪？

原題 41

企業在評估 AI 決策模型是否存在資料分布偏差時，下列何者最屬於偏見檢測（Bias Detection）而非偏見緩解（Bias Mitigation）措施？

白話

企業在評估 AI 決策模型是否存在資料分布偏差時，可以採取不同類型的措施。有些措施是在「發現問題」，有些是在「修正問題」，題目要求區分這兩種性質。

問你：下列哪個做法屬於偏見檢測（Bias Detection），而不是偏見緩解（Bias Mitigation）？

點選你的答案。

← 回 50 題列表回 iPAS 備考總覽

01　總結

一句話總結

偏見檢測是「發現有沒有偏見」，偏見緩解是「想辦法減少偏見」；比較不同資料分布下的預測錯誤率，是在診斷問題，屬於偏見檢測。

02　情境

先感受問題：你怎麼知道 AI 在歧視人？

假設「公正徵才」人資顧問公司開發了一套 AI 履歷篩選系統，用來決定哪些應徵者進入面試。系統跑了三個月，HR 主管梁美玲心裡有點不安：「這套系統對女性求職者是不是太嚴了？」

但她不確定。系統整體準確率很高，主管層也滿意效率提升。問題是「整體準確率高」不代表對每個族群都公平，有可能女性候選人的通過率系統性偏低，但因為男性人數更多，整體數字被稀釋掉了。

梁美玲的第一步，不是「馬上修模型」，而是要先確認問題存在：把男女候選人的預測通過率、錯誤拒絕率分開來看，看看兩組的分布是否有顯著差異。這個「分開來比較」的動作，就是偏見檢測。

03　對照

沒有系統性偵測，只靠直覺「感覺哪裡不對」

在偏見檢測流程建立之前，「公正徵才」的問題處理方式是這樣的：

沒有分群分析：只看整體準確率，從來不拆分「不同性別、年齡、地區的錯誤率是否相同」，偏見完全隱藏在平均值裡
靠直覺舉報：等到有候選人或部門主管反映「感覺不對」才啟動調查，這時問題可能已存在半年以上
修了就當解決：發現問題後直接改參數或閾值，但沒有重新跑分群分析確認問題是否真的被修掉，或有沒有把偏見轉移到另一個族群
偵測和緩解混在一起：一邊量測一邊改動，最後不知道哪個改動有效、問題是否被過度矯正
沒有量化基準：沒有定義「多大的差異算有偏見」，每次討論都在吵邊界，無法形成可重複的標準作業流程

結果是：問題發現得晚、修了不知道有沒有修好、下次同樣的偏見還會再出現。

04　解法

先偵測再緩解，順序不能反

梁美玲決定先建立系統性的偏見偵測流程，把「發現問題」和「修問題」分成兩個獨立階段。

第一步：分群跑預測分布。把候選人依性別、年齡區間分開，分別計算每組的通過率、假陽性率（明明合格卻被拒）、假陰性率（不合格卻通過）。如果各組的錯誤率差距超過設定的閾值，就確認偏見存在。這正是選項 A 在描述的事：比較不同資料分布的預測結果分布與錯誤率。

第二步：確認偏見存在後，才啟動緩解措施。緩解可以選加權訓練樣本（選項 B）、加輸出過濾規則（選項 C）、調整決策閾值（選項 D）。這些都是在「已知有偏見」後才做的修正動作。

這兩個階段的本質不同：偵測是「看診量測血壓」，緩解是「開藥降血壓」。沒量就開藥，可能本來沒問題反而被過度調整。

這就是選項 A 講的：比較不同資料分布的模型預測結果分布與錯誤率，是診斷動作，屬於偏見檢測。

技術版：Bias Detection 在 AI 公平性框架的位置

偏見檢測（Bias Detection）屬於 AI 公平性（AI Fairness）評估的核心工作，是 AI 治理（AI Governance）中「模型評估」階段的一環，通常在模型上線前後都要定期執行。

常見的偏見檢測指標：

統計均等（Statistical Parity）：不同族群的預測通過率是否相同
均等化機會（Equalized Odds）：不同族群的真陽性率與假陽性率是否相近
個體公平性（Individual Fairness）：相似條件的個體是否得到相似的預測結果

偏見緩解常見方法（這題的干擾選項）：

重加權（Reweighting）：訓練前調整樣本權重（選項 B）
後處理（Post-processing）：調整決策閾值或加輸出規則（選項 C、D）
對抗去偏（Adversarial Debiasing）：訓練時加入懲罰讓模型無法用敏感屬性做決策

為什麼出題者要考這個區別：AI 應用規劃師在導入決策模型時，必須知道「偵測」和「緩解」是兩個不同工作步驟，由不同角色負責，在專案中有明確的先後順序。混淆兩者會導致省略評估直接修改，或修完不驗證，無法保證公平性確實改善。

05　陷阱

為什麼其他選項是錯的

B重新加權訓練樣本以平衡資料分布代表性

字面在說什麼

把訓練資料裡各族群的樣本重新給予不同權重，讓本來資料偏少的族群在訓練時得到更多「發言權」。

為什麼不對

這是偏見緩解中「訓練前處理（Pre-processing）」的典型手段。它的目的是修正不平衡，而不是診斷是否有不平衡。已確認偏見存在之後才會啟動這個動作。

誰會選錯

看到「資料分布」就直覺跟「偵測資料分布偏差」連結在一起的人。但加權是修正動作，不是量測動作。

C在推論階段加入輸出過濾規則

字面在說什麼

模型跑完之後，用額外規則過濾或調整輸出結果，避免某些不當的預測結果直接送出去。

為什麼不對

這是偏見緩解中「後處理（Post-processing）」的方式。輸出過濾是在「已知有問題」的前提下加的防護，屬於緩解手段，不是診斷手段。

誰會選錯

認為「加過濾規則是為了確認有沒有問題」的人。過濾規則是攔截動作，不是量測動作，攔截之前通常已經知道要攔什麼了。

D調整模型決策閾值（Decision Threshold）以降低預測差異

字面在說什麼

把「模型認定通過的信心門檻」調高或調低，讓某族群的通過率和另一族群更接近。

為什麼不對

調整閾值是偏見緩解的後處理方法之一。「降低預測差異」說明它的目標是修正差距，是修正動作。偵測只是量出差距有多大，不會去「降低」它。

誰會選錯

看到題目說「降低預測差異」就覺得這是在處理偏見問題、符合題意的人。題目問的是「偵測」，調閾值是「修正」，兩件事方向相反。

06　變形

同個考點下次怎麼變形

變形 1

偏見緩解的三種主要介入時機是什麼？

直覺

「緩解」感覺就是改模型，但其實有三個不同階段可以介入。

答案

三個時機：訓練前（Pre-processing）：重新加權樣本、過採樣（oversample）弱勢族群；訓練中（In-processing）：在損失函數加入公平性懲罰項；訓練後（Post-processing）：調整決策閾值、加輸出規則。偵測不屬於任何一個，是獨立的「評估」階段。

變形 2

整體模型準確率高，代表模型對每個族群都公平嗎？

直覺

準確率是最常看的指標，高準確率應該代表模型表現好。

答案

不代表。當資料集中某族群佔多數時，整體準確率被多數族群拉高，少數族群的錯誤率可能極高卻被稀釋。這正是偏見檢測存在的原因：必須分群計算錯誤率，才能發現隱藏在平均值裡的不公平。

變形 3

什麼是統計均等（Statistical Parity），它屬於偵測還是緩解？

直覺

「統計均等」聽起來是目標，不確定是偵測工具還是緩解結果。

答案

統計均等是偵測的量測標準：計算不同族群的正向預測率是否相等。如果不等，就代表偵測到偏見存在。達到統計均等是緩解的目標，但量測它是否達到，屬於偵測行為。

變形 4

AI 公平性評估應該只在模型上線前做一次嗎？

直覺

上線前通過測試就沒問題了，不用一直重複做。

答案

不對。使用者行為、資料分布會隨時間改變（即資料漂移），模型上線後的實際族群分布可能跟訓練時不同，導致原本公平的模型逐漸出現偏見。應定期執行偏見檢測，不是只做一次。

變形 5

調整決策閾值緩解偏見，可能帶來什麼副作用？

直覺

調低某族群的通過門檻，讓他們更容易通過，這樣不是很公平嗎？

答案

調整閾值可能引發「精確率與召回率的取捨」問題：降低一個族群的門檻，會提高假陽性率（讓不符合條件的人通過）。此外，為不同族群設不同閾值，在某些法律框架下本身就被視為歧視。緩解措施需要搭配重新偵測，確認改善效果且沒有產生新的偏差。

07　延伸

想再往下看，這 5 個

人工智慧公平性（Fairness in AI）確保 AI 系統對不同族群產生公平結果的原則，偏見檢測與偏見緩解是實現此原則的兩個必要步驟
演算法偏見（Algorithmic Bias）模型因訓練資料或設計導致對特定族群系統性不公平的現象，本題要求能區分偵測此問題和修正此問題的不同手段
AI偏見（Bias in AI）AI 系統中因資料偏差或模型設計導致輸出不公平的廣義問題，偵測是識別是否存在，緩解是減少其影響
資料不平衡（Data Imbalance）訓練資料中各族群樣本數量差異懸殊的問題，是資料分布偏差的主要形式，也是偏見檢測要發現的根源之一
AI治理（AI Governance）管理 AI 系統開發與部署的政策框架，偏見檢測與緩解是其中的稽核環節，兩者需先後分開執行才有效