偏差(Bias)是什麼?

偏差是模型對特定族群或特徵產生系統性錯誤傾向,源自訓練資料不平衡或演算法設計缺陷|本頁含完整原理、應用場景、iPAS 考試重點與 3 個常見問答。

偏差(Bias)是什麼? iPAS 模型訓練模型評估

模型老是偏向同一邊,不管資料怎麼變都差不多往那個方向錯,這算什麼問題? 你可以把偏差想成系統性偏離真相的傾向,像箭一直射同一邊。 它可能來自資料不平衡、模型太簡單,或設計上本來就有偏向。

你可以把它想成一個把抽象概念拉回日常判斷的提示,先知道它解決什麼問題,再看技術細節。

容易混淆

偏差 vs 方差? 偏差:系統性地往某方向錯 方差:對不同資料很不穩定 最關鍵的區別:偏差看方向一致,方差看穩不穩

偏差 vs 誤差? 偏差:有時也會指公平性偏見 誤差:泛指預測和真值的差距 最關鍵的區別:在模型評估和公平議題裡,偏差的語意不完全一樣

偏差 vs 過擬合? 偏差:常和欠擬合有關 過擬合:模型把訓練資料記太熟 最關鍵的區別:偏差高常是學不夠,過擬合則是記太多

記住這句就好

每次都往同一邊錯,多半就是偏差高

實際案例

貸款審核 模型對某些族群總是偏嚴格,這可能是資料分布或特徵設計造成的偏差

影像辨識 如果訓練資料幾乎都來自白天,模型一到夜間就一直判錯,也是一種系統性偏差

iPAS 考題

Q:偏差和方差有什麼不同? 偏差是系統性錯誤,方差是對不同資料的敏感程度。

Q:偏差高通常代表什麼? 通常代表模型太簡單或學習不足,容易欠擬合。

算法與應用

重點 你要看什麼 為什麼重要
來源 資料、模型、流程 偏差不一定只來自模型本身
偵測 群體比較、誤差分析 要看是不是某些族群特別受影響
修正 補資料、改特徵、調模型 降低系統性偏離

情境判斷

Q1:訓練和測試都很差,而且錯誤方向很一致,這更像偏差還是方差? → 更像偏差,因為它是系統性地錯在同一邊

Q2:如果模型在不同資料上忽高忽低,但平均來看不一定偏一邊,這更像什麼? → 更像方差,因為不穩定性比固定方向的錯誤更明顯

常見問題

偏差一定是壞事嗎?

不一定。某些情境下適度偏差能換來更穩定的模型。

要怎麼降低偏差?

通常要從更多資料、更好的特徵或更有表達力的模型下手。

公平性偏差和統計偏差一樣嗎?

不完全一樣,前者更關心不同群體是否受到不公正對待。

範例考題

某零售企業導入生成式 AI 商品推薦系統。測試結果顯示,在購物行為、偏好設定與價格區間相同的情況下,不同客戶族群收到的推薦商品類型仍出現明顯差異,且差異方向不易以既有行銷策略解釋。若在模型架構與推論設定皆未調整情形下,專案目標是優先降低可能的模型偏差風險,下列何者最合理?

  • A. 重新檢視訓練資料的樣本分布與代表性 ✓ 正確答案
  • B. 限制推薦結果僅顯示高銷量商品
  • C. 降低模型參數規模以簡化決策邏輯
  • D. 提高推薦結果的隨機性以增加多樣性

解析:

當模型在相同條件下對不同族群產生系統性差異,最可能的根因是訓練資料的分布不均衡或代表性不足,導致模型學習到隱含偏差。優先檢視訓練資料的樣本分布與代表性是最直接有效的偏差診斷方式。

企業在評估 AI 決策模型是否存在資料分布偏差時,下列何者最屬於偏見檢測(Bias Detection)而非偏見緩解(Bias Mitigation)措施?

  • A. 比較不同資料分布的模型預測結果分布與錯誤率 ✓ 正確答案
  • B. 重新加權訓練樣本以平衡資料分布代表性
  • C. 在推論階段加入輸出過濾規則
  • D. 調整模型決策閾值(Decision Threshold)以降低預測差異

解析:

偏見檢測是發現偏差的過程,比較不同資料分布的預測結果與錯誤率屬於檢測行為;其他選項都是發現偏差後採取的緩解措施。

立即測驗

想測試你對 偏差 的掌握程度? 開始模擬考