你有沒有看過履歷篩選系統,總是把某些人排得比較後面?
你可以把演算法偏見想成模型學到了不公平的規律,結果對某些族群特別不利。它不一定是故意歧視,但輸出結果真的會讓人感到不公平。
這很重要,因為一旦偏見進到招募、貸款、教育或醫療,傷害會直接落在人身上,不只是數字看起來怪而已。
容易混淆
演算法偏見 vs 人工智慧公平性
偏見是問題現象。
公平性是希望達到的目標。
最關鍵的區別:一個是偏掉,一個是拉回來。
演算法偏見 vs AI倫理
偏見是倫理關心的具體案例。
倫理還包含責任、透明和隱私。
最關鍵的區別:偏見是其中一種倫理風險。
演算法偏見 vs 資料偏差
資料偏差是來源。
演算法偏見是最後在模型結果裡看到的偏差。
最關鍵的區別:來源和結果不同。
記住這句就好
模型不是只要準,還要對所有人都差不多公平。
實際案例
招募系統
若歷史資料裡某類候選人過去比較少被錄取,模型可能學到這個模式,之後就持續把同類人選排低,這就是偏見會自我放大。
貸款審核
當模型對某些地區或年齡層的拒貸率特別高,就算沒有明寫歧視,結果也可能讓某些族群更難借到錢。
算法與應用
怎麼發現偏見
先切族群看錯誤率,再看不同群體的通過率、召回率和誤判率是否差很多。
怎麼減少偏見
改資料、改特徵、重加權、後處理校正、人工審核,常常要一起做才有效。
情境判斷
Q1(直覺題): 一個模型整體準確率很高,但某個族群的錯誤率明顯更高,這算不算問題?
→ 算。整體高分不代表所有人都受到同樣待遇,這就是偏見要看的地方。
Q2(判斷題): 只要把性別欄位拿掉,模型就一定不會有偏見嗎?
→ 不一定,這要看情況。模型可能用其他欄位間接推回性別資訊,所以還要看結果是否真的公平。
iPAS 考題
出題方向: 常考偏見來源、如何檢測不同族群表現差異,以及公平性和準確率的取捨。
題目 下列何者最能描述演算法偏見?
→ 演算法因資料或設計因素,對特定族群產生不公平結果。
常見問題
演算法偏見一定是故意的嗎?
不一定,很多偏見是資料歷史包袱或設計選擇累積出來的。
偏見只會出現在大型模型嗎?
不是,小模型一樣會有,只要資料或規則有問題就可能發生。
怎麼知道模型有沒有偏見?
不能只看總準確率,要分群體看表現差異。
偏見修掉後準確率會下降嗎?
有可能,但常常是必要的取捨,因為你要換來更公平的結果。