iPAS AI 應用規劃師初級　科目二　生成式 AI 應用與規劃

推薦模型上線後越來越不準，最可能是什麼原因？

原題 48

某企業將機器學習模型部署於線上推薦系統。模型在測試階段表現良好，但上線數月後，點擊率與預測準確度逐漸下降。經分析發現，近期使用者行為模式與模型訓練期間的資料特徵出現顯著變化。此現象最可能屬於下列何者？

白話

某企業將機器學習模型部署於線上推薦系統，測試階段表現良好，但上線數月後點擊率與預測準確度逐漸下降。分析發現，近期使用者行為模式與模型訓練期間的資料特徵出現顯著變化。

問你：這個現象最可能屬於下列哪一種情形？

點選你的答案。

← 回 50 題列表回 iPAS 備考總覽

01　總結

一句話總結

模型測試好但上線後隨時間衰退，且分析出使用者行為與訓練資料有顯著差異，這是資料漂移（Data Drift）：資料統計特徵隨時間改變，讓模型的推論越來越不準。

02　情境

先感受問題：去年學的食譜，今年大家都不想吃了

「好物嚴選」是一個電商平台，資料科學家林思潔在 2024 年用歷史購物資料訓練了一套商品推薦模型，測試表現很好，上線後頭兩個月也確實提升了點擊率。

但到了 2025 年初，林思潔發現推薦的點擊率開始下降，準確率也逐漸滑落。她調出資料分析，發現問題所在：2024 年訓練時，使用者最喜歡點的品類是「運動健身器材」；但進入 2025 年，平台的使用者開始大量點擊「家居佈置」和「廚房用品」，興趣偏好整體轉移了。

模型還是 2024 年的模型，它學的是「使用者喜歡運動健身」，但現在的使用者喜歡的東西不一樣了。模型的世界觀還停留在過去，現實已經改變了。

這就是資料漂移（Data Drift）：真實世界的資料統計特徵隨時間改變，讓模型的預測越來越偏離實際。

03　對照

沒有模型監控機制，資料漂移會被忽略很久

在林思潔建立定期監控機制之前，「好物嚴選」的模型管理方式有這些問題：

只看整體指標：追蹤整體點擊率，但沒有按品類、按時間段分解，漂移被整體數字稀釋，看不出來
沒有特徵分布監控：沒有定期比較「當前使用者行為分布」和「訓練時的行為分布」，不知道資料已經漂移
模型上線就不管了：模型被視為一次性資產，上線後沒有維護計畫，沒有觸發再訓練的機制
把效能下降歸因錯誤：點擊率下降被解釋為「產品上架組合問題」或「競爭對手影響」，實際上是模型過時了
沒有基準比較：沒有在上線時記錄訓練資料的特徵統計值，事後想比較也沒有基準

資料漂移是「慢性病」，不是急性故障，沒有監控就會被慢慢忽略，直到損失已經很大才被發現。

04　解法

識別資料漂移並建立應對機制

林思潔確認問題是資料漂移後，建立了應對方案。

定期監控特徵分布：每週自動計算當前使用者行為的品類偏好分布，與訓練時的基準分布做比對。當偏差超過閾值，自動發出警報。

滾動更新訓練資料：每個月用最近三個月的新資料重新訓練模型，讓模型持續學習最新的使用者行為模式，避免「模型的世界觀停留在過去」。

A/B 測試監控衰退速度：維持一小部分流量跑舊模型，持續監控新舊模型的表現差異，量化漂移的影響速度，調整再訓練頻率。

這就是選項 C 講的：資料統計特徵隨時間改變，影響模型推論效果，是本題描述的「測試好但上線後隨時間衰退、且行為模式改變」現象的標準術語，也就是資料漂移（Data Drift）。

技術版：資料漂移（Data Drift）和概念漂移（Concept Drift）

「漂移」是 ML 模型部署後性能下降的主要原因之一，分為兩種類型：

資料漂移（Data Drift / Covariate Shift）：輸入特徵的統計分布改變了，但特徵與標籤的關係不變。例如：使用者年齡分布變了（以前 20-30 歲為主，現在 40-50 歲為主），但「年齡影響購物偏好」的關係本身沒變
概念漂移（Concept Drift）：特徵與標籤的關係本身改變了。例如：以前「看過 A 商品的人傾向買 B」，但現在競爭品牌出現後，這個關係改變了

本題是資料漂移：「近期使用者行為模式與訓練期間資料特徵出現顯著變化」，說的是輸入資料的統計特徵改變了，這正是資料漂移的定義。

資料漂移監控常用方法：

PSI（Population Stability Index）：量化特徵分布的穩定程度
KS Test（Kolmogorov-Smirnov）：統計檢定兩個分布是否有顯著差異
特徵統計監控：追蹤每個特徵的均值、標準差、分位數的變化

為什麼出題者要考這題：AI 應用規劃師必須知道「模型上線不等於永久有效」，模型需要定期監控和再訓練，這是 MLOps 的核心理念。了解資料漂移的概念，才能設計正確的模型維護計畫。

05　陷阱

為什麼其他選項是錯的

A模型過度擬合訓練資料，無法泛化至未知樣本

字面在說什麼

模型太「記住」訓練資料的細節，遇到訓練資料以外的新情況就表現很差。

為什麼不對

過度擬合的問題在測試階段就會被發現，因為測試集也是「模型沒見過的資料」。題目說「測試階段表現良好」，說明模型對新樣本的泛化是沒問題的，排除過度擬合。過度擬合的症狀是「訓練準確率高、測試準確率低」，不是「測試好、上線後隨時間變差」。

誰會選錯

知道「過度擬合導致模型表現變差」但沒有注意時間順序的人。過度擬合是訓練→測試就有的問題，不是上線後才出現的問題。

B特徵工程設計不佳，導致輸入資訊不足

字面在說什麼

在設計模型時，選用的特徵（輸入變數）不夠好或不夠多，導致模型學不到足夠的規律。

為什麼不對

特徵設計的問題在測試階段就應該被發現。如果測試時表現良好，說明特徵設計在訓練時間段是足夠的。特徵設計問題是「一開始就有的先天不足」，不是「上線後才逐漸浮現的後天問題」。

誰會選錯

遇到模型表現不佳就直覺認為「是特徵工程的問題」的人。這是常見但不精準的歸因，需要根據「問題是什麼時候出現的」來區分。

D系統資料結構調整，造成特徵欄位錯置

字面在說什麼

後端資料庫或資料管線被修改，導致某些特徵欄位的數值對應到了錯誤的變數，模型讀到錯誤的輸入。

為什麼不對

欄位錯置是技術問題，通常會造成模型效能「突然崩潰」而不是「逐漸下降」，而且一般可以通過資料管線的監控快速發現。題目強調的是「逐漸下降」和「使用者行為模式改變」，這是漸進式的現象，不符合技術錯誤的特徵。

誰會選錯

認為模型下降「一定是技術問題」的人。技術問題是一種可能性，但題目給出了「使用者行為改變」這個分析結果，直接指向資料漂移。

06　變形

同個考點下次怎麼變形

變形 1

資料漂移和概念漂移的差別是什麼？

直覺

都是「漂移」，有什麼本質不同？

答案

資料漂移：輸入特徵的分布改變了，但特徵預測標籤的規律沒變（例如：用戶年齡分布從年輕為主變成中年為主）。概念漂移：特徵和標籤的關係本身改變了（例如：以前「喜歡 A 的人也喜歡 B」，但現在這個關係不成立了）。兩者都會讓模型退化，但根本原因和解決方式不同。

變形 2

如何偵測到模型發生了資料漂移？

直覺

效能下降就知道有漂移了，還需要主動偵測嗎？

答案

等到效能下降才知道已經為時較晚。主動偵測方式：特徵分布監控（定期比較當前輸入資料與訓練資料的統計特徵，如均值、標準差、分位數）；PSI 指數（超過 0.2 表示顯著漂移）；預測分布監控（觀察模型輸出的分布是否異常偏移）。理想的監控是在效能下降前就發現漂移的跡象。

變形 3

過度擬合（Overfitting）的典型症狀是什麼？

直覺

過度擬合和資料漂移都會讓模型表現變差，怎麼分辨？

答案

過度擬合的典型症狀：訓練準確率極高（99%+），但測試準確率明顯低（如 80%），這個差距在訓練和評估就能看出來。資料漂移則是：訓練和測試都表現良好，但上線後隨時間退化。時間軸是關鍵區別：過度擬合在訓練後立即顯現，資料漂移在上線後隨時間出現。

變形 4

面對資料漂移，模型再訓練（Retraining）的策略有哪些？

直覺

重新訓練就好了，有什麼策略好說的？

答案

三種常見策略：定期再訓練（固定週期，如每月用最近三個月資料再訓練，簡單可預測）；觸發式再訓練（監控到漂移指標超過閾值才再訓練，節省計算資源）；增量學習（Online Learning）（模型持續用新資料更新，適合高頻率漂移的場景）。策略選擇取決於漂移速度和可接受的效能下降程度。

變形 5

為什麼「模型上線不等於工作完成」？

直覺

測試通過、部署完成，不就結束了嗎？

答案

真實世界的資料不會靜止不變：使用者行為改變、商品組合更新、季節性變化、外部事件（如疫情、政策）都會改變資料分布。模型上線是起點而不是終點，MLOps 的核心概念就是「把模型生命週期管理（訓練→部署→監控→再訓練）作為持續的工程工作」，而不是一次性專案。

07　延伸

想再往下看，這 5 個

資料漂移（Data Drift）模型上線後，輸入資料的統計分布逐漸偏離訓練時的分布，導致模型預測準確率下降，是 ML 模型退化的主要原因之一
概念漂移（Concept Drift）特徵與標籤之間的關係隨時間改變，模型學到的規律不再適用，比資料漂移更難偵測和修復
MLOps（Machine Learning Operations）將 ML 模型的訓練、部署、監控、再訓練整合成持續工程流程的實踐，確保模型在真實環境長期穩定運作
模型監控（Model Monitoring）持續追蹤模型上線後的效能指標和輸入資料特徵，及早發現退化或漂移的跡象
過度擬合（Overfitting）模型過度學習訓練資料的雜訊和細節，在訓練集表現優異但無法泛化到新資料，是模型設計階段就會出現的問題，與資料漂移的時間點不同