iPAS AI 應用規劃師初級　科目二　生成式 AI 應用與規劃

模型偏差風險怎麼降低？

原題 01

某零售企業導入生成式 AI 商品推薦系統。測試結果顯示，在購物行為、偏好設定與價格區間相同的情況下，不同客戶族群收到的推薦商品類型仍出現明顯差異，且差異方向不易以既有行銷策略解釋。若在模型架構與推論設定皆未調整情形下，專案目標是優先降低可能的模型偏差風險，下列何者最合理？

白話

某零售企業的生成式 AI 商品推薦系統，在購物行為、偏好設定與價格區間都相同的情況下，不同客戶族群收到的推薦商品類型仍出現明顯差異，而且這個差異用既有行銷策略解釋不了。模型架構和推論設定都沒有調整過，現在的目標是優先降低可能的模型偏差風險。

問你：在不調整模型架構與推論設定的前提下，哪個做法最合理？

點選你的答案。

← 回 50 題列表回 iPAS 備考總覽

01　總結

一句話總結

模型偏差的根源在訓練資料，重新檢視樣本分布與代表性是降低偏差風險最直接的切入點，而不是限制輸出或改模型架構。

02　情境

先感受問題：推薦系統為什麼會「差別對待」？

假設你在「好購物」電商任職，負責導入 AI 商品推薦系統。系統上線後，主管發現一個奇怪現象：

王小明（台北，25 歲，月消費 3,000 元）推薦清單：運動用品、電子配件
陳美玲（台北，25 歲，月消費 3,000 元）推薦清單：家居用品、護膚產品

兩個人的購物行為、偏好設定、消費金額完全一樣，但推薦結果卻截然不同，而且差異明顯沿著性別分組。行銷部門說：「我們從來沒有設定『男生看這個、女生看那個』的規則啊！」

這不是模型故意歧視，而是訓練資料裡早就藏著偏見：如果男性購買運動用品的歷史資料多、女性的少，模型就從這個不均衡的資料裡學到了錯誤的關聯，然後把它複製到推薦結果上。

03　對照

不找資料問題，只改輸出，會怎樣？

如果「好購物」的工程師沒有去檢查資料，而是用別的方式「修表面」：

限制只推高銷量商品：所有人看到的都是暢銷榜，個人化消失，但偏差的根本原因還在，只是被掩蓋了
增加推薦隨機性：亂槍打鳥，推薦多樣了，但不精準，使用者體驗變差，轉換率下滑
縮小模型參數：模型變簡單了，但資料本身的偏見還在，小模型只會更快把偏見學進去
繼續上線等觀察：問題沒處理，偏差持續發生，監管風險累積，等到被媒體報導才發現
只改推論門檻：強行壓低某族群的推薦分數，是補丁不是根治，而且可能讓其他族群的體驗變差

這幾個做法都有一個共同盲點：跳過了問題的源頭，直接在下游打補丁。

04　解法

偏差要從資料下手

「好購物」的 AI 工程師決定用正確的方式處理：回到訓練資料，找出樣本分布的問題。

第一步，做樣本分布分析：把訓練資料按照族群切開，看每個族群的購買記錄數量、商品類別比例是否均衡。結果發現：歷史資料裡，男性的運動用品購買記錄是女性的 4 倍，但這只是因為過去的行銷活動主要針對男性投放，不代表女性真的不買。

第二步，評估代表性：這批資料能不能代表「所有可能的顧客」？顯然不能，因為它帶著歷史行銷偏見。

第三步，制定資料修正策略：可以補充更多元的資料、做資料重採樣（re-sampling）讓各族群比例平衡、或在訓練時加入公平性約束。

這就是選項 A 講的：重新檢視訓練資料的樣本分布與代表性，這才是降低模型偏差風險最根本的方法。

技術版：模型偏差在 AI 專案中的位置

模型偏差（Model Bias）屬於 AI 倫理與公平性（AI Fairness）領域的核心議題，是生成式 AI 應用規劃師在部署前必須評估的風險項目之一。

偏差的來源分類：

歷史偏差（Historical Bias）：訓練資料反映了過去社會的不平等，模型把這個不平等學進去了
樣本偏差（Sampling Bias）：某些族群的資料量太少，模型對這些族群的預測能力弱
測量偏差（Measurement Bias）：資料收集方式本身就偏向某些群體

為什麼不是改模型架構：題目明確說「模型架構與推論設定皆未調整」，而且即使改了架構，如果資料本身有偏差，新架構一樣會學到偏見。根因在資料，不在架構。

為什麼出題者要考這題：AI 應用規劃師的職責之一是識別並降低 AI 系統的倫理風險。偏差問題是生成式 AI 在商業應用中最常見的合規風險，規劃師必須知道偏差的根源在資料，而不是在模型參數或輸出設定。

相關術語對比：模型偏差（Bias）vs. 模型變異數（Variance）是機器學習的基本取捨，但這題考的是公平性層面的偏差，是社會意義上的，跟 Bias-Variance Tradeoff 不同。

05　陷阱

為什麼其他選項是錯的

B限制推薦結果僅顯示高銷量商品

字面在說什麼

把推薦清單限縮到暢銷商品，每個人看到差不多的東西，表面上消除了族群差異。

為什麼不對

這是掩蓋症狀，不是治病。偏差的根源（不均衡的訓練資料）沒有被處理，只是強行讓輸出看起來一樣。個人化能力也因此消失，系統的商業價值大幅降低。

誰會選錯

直覺認為「推薦結果一樣 = 沒有歧視」的人。但強制一致和真正公平是兩件事，前者是犧牲個人化換來表面平等。

C降低模型參數規模以簡化決策邏輯

字面在說什麼

把模型縮小，讓決策邏輯變簡單，希望藉此減少偏差。

為什麼不對

題目說架構不動。而且即使縮小模型，如果訓練資料有偏差，簡單模型只會更快把偏差學進去，甚至更難修正，因為它沒有能力捕捉複雜的公平性規律。

誰會選錯

混淆「過擬合」和「偏差」的人。過擬合確實可以靠縮小模型改善，但公平性偏差的源頭在資料，不在模型複雜度。

D提高推薦結果的隨機性以增加多樣性

字面在說什麼

在推薦時加入隨機因子，讓結果更多樣，希望打破固定的偏差模式。

為什麼不對

隨機性可以增加多樣性，但不能消除偏差，只是讓偏差的表現變得更隨機而已。而且隨機推薦會傷害準確率，使用者轉換率下降，反而帶來新問題。

誰會選錯

把「多樣性」和「公平性」混為一談的人。多樣性是推薦內容豐不豐富的問題；公平性是不同族群受到不同對待的問題，兩者不同。

06　變形

同個考點下次怎麼變形

變形 1

AI 系統出現族群偏差，最根本的原因通常是什麼？

直覺

感覺可能是模型太複雜、或是演算法有問題。

答案

最根本原因通常是訓練資料本身存在樣本不均衡或歷史偏見。模型從偏差的資料中學習，自然輸出偏差的結果。架構再好，資料有問題就沒用。

變形 2

什麼是樣本代表性（Sample Representativeness）？為什麼它對 AI 公平性很重要？

直覺

資料夠多應該就夠了吧？

答案

樣本代表性是指訓練資料能不能公平地反映「所有目標使用者」的多樣性。資料量多但不均衡，模型依然會偏向資料量多的族群。有代表性的資料比資料量大更重要。

變形 3

模型偏差（Bias）和過擬合（Overfitting）在原因上有什麼不同？

直覺

兩個都讓模型表現不好，應該原因差不多？

答案

過擬合是模型對訓練資料記憶太深、泛化能力差，靠減少模型複雜度或增加資料量改善。公平性偏差是資料本身的分布不均衡，靠改善資料代表性來解決。兩者原因不同，解法也不同。

變形 4

在生成式 AI 應用上線前，如何提前發現潛在的偏差風險？

直覺

上線後看結果不就知道了？

答案

上線前應進行公平性測試（Fairness Evaluation）：將測試集按族群切分，檢查不同族群的模型輸出是否有系統性差異。這比等上線後才發現問題要好得多，能在傷害發生前修正。

變形 5

AI 應用規劃師在規劃推薦系統時，應在哪個階段把偏差風險納入考量？

直覺

等模型訓練好再來看偏差問題？

答案

應在資料收集與標記階段就開始評估，而不是等到模型訓練完或上線後。早期介入成本最低：補充代表性資料、制定公平性評估指標，比事後打補丁有效率得多。

07　延伸

想再往下看，這 5 個

AI偏見（Bias in AI）AI 系統因訓練資料不均衡而對特定族群產生系統性不公平輸出，推薦結果族群差異是典型案例
演算法偏見（Algorithmic Bias）演算法從帶有偏見的歷史資料中學習並放大不公平的現象，是模型偏差的主要成因之一
人工智慧公平性（Fairness in AI）確保 AI 不因族群、性別等特徵產生歧視性差異的設計原則，與降低偏差直接相關
資料不平衡（Data Imbalance）訓練資料中各族群樣本比例懸殊，會導致模型偏向多數族群，是推薦差異的常見根因
負責任AI（Responsible AI）涵蓋公平性、透明性、可解釋性的 AI 開發框架，降低模型偏差是其核心要求之一