iPAS AI 應用規劃師 初級 科目二 生成式 AI 應用與規劃

推薦模型上線後越來越不準,最可能是什麼原因?

原題 48

某企業將機器學習模型部署於線上推薦系統。模型在測試階段表現良好,但上線數月後,點擊率與預測準確度逐漸下降。經分析發現,近期使用者行為模式與模型訓練期間的資料特徵出現顯著變化。此現象最可能屬於下列何者?

白話

某企業將機器學習模型部署於線上推薦系統,測試階段表現良好,但上線數月後點擊率與預測準確度逐漸下降。分析發現,近期使用者行為模式與模型訓練期間的資料特徵出現顯著變化。

問你:這個現象最可能屬於下列哪一種情形?

點選你的答案。

01 總結

一句話總結

模型測試好但上線後隨時間衰退,且分析出使用者行為與訓練資料有顯著差異,這是資料漂移(Data Drift):資料統計特徵隨時間改變,讓模型的推論越來越不準

02 情境

先感受問題:去年學的食譜,今年大家都不想吃了

「好物嚴選」是一個電商平台,資料科學家林思潔在 2024 年用歷史購物資料訓練了一套商品推薦模型,測試表現很好,上線後頭兩個月也確實提升了點擊率。

但到了 2025 年初,林思潔發現推薦的點擊率開始下降,準確率也逐漸滑落。她調出資料分析,發現問題所在:2024 年訓練時,使用者最喜歡點的品類是「運動健身器材」;但進入 2025 年,平台的使用者開始大量點擊「家居佈置」和「廚房用品」,興趣偏好整體轉移了。

模型還是 2024 年的模型,它學的是「使用者喜歡運動健身」,但現在的使用者喜歡的東西不一樣了。模型的世界觀還停留在過去,現實已經改變了。

這就是資料漂移(Data Drift):真實世界的資料統計特徵隨時間改變,讓模型的預測越來越偏離實際。

03 對照

沒有模型監控機制,資料漂移會被忽略很久

在林思潔建立定期監控機制之前,「好物嚴選」的模型管理方式有這些問題:

  1. 只看整體指標:追蹤整體點擊率,但沒有按品類、按時間段分解,漂移被整體數字稀釋,看不出來
  2. 沒有特徵分布監控:沒有定期比較「當前使用者行為分布」和「訓練時的行為分布」,不知道資料已經漂移
  3. 模型上線就不管了:模型被視為一次性資產,上線後沒有維護計畫,沒有觸發再訓練的機制
  4. 把效能下降歸因錯誤:點擊率下降被解釋為「產品上架組合問題」或「競爭對手影響」,實際上是模型過時了
  5. 沒有基準比較:沒有在上線時記錄訓練資料的特徵統計值,事後想比較也沒有基準

資料漂移是「慢性病」,不是急性故障,沒有監控就會被慢慢忽略,直到損失已經很大才被發現。

04 解法

識別資料漂移並建立應對機制

林思潔確認問題是資料漂移後,建立了應對方案。

定期監控特徵分布:每週自動計算當前使用者行為的品類偏好分布,與訓練時的基準分布做比對。當偏差超過閾值,自動發出警報。

滾動更新訓練資料:每個月用最近三個月的新資料重新訓練模型,讓模型持續學習最新的使用者行為模式,避免「模型的世界觀停留在過去」。

A/B 測試監控衰退速度:維持一小部分流量跑舊模型,持續監控新舊模型的表現差異,量化漂移的影響速度,調整再訓練頻率。

這就是選項 C 講的:資料統計特徵隨時間改變,影響模型推論效果,是本題描述的「測試好但上線後隨時間衰退、且行為模式改變」現象的標準術語,也就是資料漂移(Data Drift)。

技術版:資料漂移(Data Drift)和概念漂移(Concept Drift)

「漂移」是 ML 模型部署後性能下降的主要原因之一,分為兩種類型:

  • 資料漂移(Data Drift / Covariate Shift):輸入特徵的統計分布改變了,但特徵與標籤的關係不變。例如:使用者年齡分布變了(以前 20-30 歲為主,現在 40-50 歲為主),但「年齡影響購物偏好」的關係本身沒變
  • 概念漂移(Concept Drift):特徵與標籤的關係本身改變了。例如:以前「看過 A 商品的人傾向買 B」,但現在競爭品牌出現後,這個關係改變了

本題是資料漂移:「近期使用者行為模式與訓練期間資料特徵出現顯著變化」,說的是輸入資料的統計特徵改變了,這正是資料漂移的定義。

資料漂移監控常用方法:

  • PSI(Population Stability Index):量化特徵分布的穩定程度
  • KS Test(Kolmogorov-Smirnov):統計檢定兩個分布是否有顯著差異
  • 特徵統計監控:追蹤每個特徵的均值、標準差、分位數的變化

為什麼出題者要考這題:AI 應用規劃師必須知道「模型上線不等於永久有效」,模型需要定期監控和再訓練,這是 MLOps 的核心理念。了解資料漂移的概念,才能設計正確的模型維護計畫。

05 陷阱

為什麼其他選項是錯的

A模型過度擬合訓練資料,無法泛化至未知樣本

字面在說什麼

模型太「記住」訓練資料的細節,遇到訓練資料以外的新情況就表現很差。

為什麼不對

過度擬合的問題在測試階段就會被發現,因為測試集也是「模型沒見過的資料」。題目說「測試階段表現良好」,說明模型對新樣本的泛化是沒問題的,排除過度擬合。過度擬合的症狀是「訓練準確率高、測試準確率低」,不是「測試好、上線後隨時間變差」。

誰會選錯

知道「過度擬合導致模型表現變差」但沒有注意時間順序的人。過度擬合是訓練→測試就有的問題,不是上線後才出現的問題。

B特徵工程設計不佳,導致輸入資訊不足

字面在說什麼

在設計模型時,選用的特徵(輸入變數)不夠好或不夠多,導致模型學不到足夠的規律。

為什麼不對

特徵設計的問題在測試階段就應該被發現。如果測試時表現良好,說明特徵設計在訓練時間段是足夠的。特徵設計問題是「一開始就有的先天不足」,不是「上線後才逐漸浮現的後天問題」。

誰會選錯

遇到模型表現不佳就直覺認為「是特徵工程的問題」的人。這是常見但不精準的歸因,需要根據「問題是什麼時候出現的」來區分。

D系統資料結構調整,造成特徵欄位錯置

字面在說什麼

後端資料庫或資料管線被修改,導致某些特徵欄位的數值對應到了錯誤的變數,模型讀到錯誤的輸入。

為什麼不對

欄位錯置是技術問題,通常會造成模型效能「突然崩潰」而不是「逐漸下降」,而且一般可以通過資料管線的監控快速發現。題目強調的是「逐漸下降」和「使用者行為模式改變」,這是漸進式的現象,不符合技術錯誤的特徵。

誰會選錯

認為模型下降「一定是技術問題」的人。技術問題是一種可能性,但題目給出了「使用者行為改變」這個分析結果,直接指向資料漂移。

06 變形

同個考點下次怎麼變形

變形 1

資料漂移和概念漂移的差別是什麼?

直覺

都是「漂移」,有什麼本質不同?

答案

資料漂移:輸入特徵的分布改變了,但特徵預測標籤的規律沒變(例如:用戶年齡分布從年輕為主變成中年為主)。概念漂移:特徵和標籤的關係本身改變了(例如:以前「喜歡 A 的人也喜歡 B」,但現在這個關係不成立了)。兩者都會讓模型退化,但根本原因和解決方式不同。

變形 2

如何偵測到模型發生了資料漂移?

直覺

效能下降就知道有漂移了,還需要主動偵測嗎?

答案

等到效能下降才知道已經為時較晚。主動偵測方式:特徵分布監控(定期比較當前輸入資料與訓練資料的統計特徵,如均值、標準差、分位數);PSI 指數(超過 0.2 表示顯著漂移);預測分布監控(觀察模型輸出的分布是否異常偏移)。理想的監控是在效能下降前就發現漂移的跡象。

變形 3

過度擬合(Overfitting)的典型症狀是什麼?

直覺

過度擬合和資料漂移都會讓模型表現變差,怎麼分辨?

答案

過度擬合的典型症狀:訓練準確率極高(99%+),但測試準確率明顯低(如 80%),這個差距在訓練和評估就能看出來。資料漂移則是:訓練和測試都表現良好,但上線後隨時間退化。時間軸是關鍵區別:過度擬合在訓練後立即顯現,資料漂移在上線後隨時間出現。

變形 4

面對資料漂移,模型再訓練(Retraining)的策略有哪些?

直覺

重新訓練就好了,有什麼策略好說的?

答案

三種常見策略:定期再訓練(固定週期,如每月用最近三個月資料再訓練,簡單可預測);觸發式再訓練(監控到漂移指標超過閾值才再訓練,節省計算資源);增量學習(Online Learning)(模型持續用新資料更新,適合高頻率漂移的場景)。策略選擇取決於漂移速度和可接受的效能下降程度。

變形 5

為什麼「模型上線不等於工作完成」?

直覺

測試通過、部署完成,不就結束了嗎?

答案

真實世界的資料不會靜止不變:使用者行為改變、商品組合更新、季節性變化、外部事件(如疫情、政策)都會改變資料分布。模型上線是起點而不是終點,MLOps 的核心概念就是「把模型生命週期管理(訓練→部署→監控→再訓練)作為持續的工程工作」,而不是一次性專案。

07 延伸

想再往下看,這 5 個

  • 資料漂移(Data Drift)模型上線後,輸入資料的統計分布逐漸偏離訓練時的分布,導致模型預測準確率下降,是 ML 模型退化的主要原因之一
  • 概念漂移(Concept Drift)特徵與標籤之間的關係隨時間改變,模型學到的規律不再適用,比資料漂移更難偵測和修復
  • MLOps(Machine Learning Operations)將 ML 模型的訓練、部署、監控、再訓練整合成持續工程流程的實踐,確保模型在真實環境長期穩定運作
  • 模型監控(Model Monitoring)持續追蹤模型上線後的效能指標和輸入資料特徵,及早發現退化或漂移的跡象
  • 過度擬合(Overfitting)模型過度學習訓練資料的雜訊和細節,在訓練集表現優異但無法泛化到新資料,是模型設計階段就會出現的問題,與資料漂移的時間點不同
出處

iPAS 經濟部產業人才能力鑑定 ・ 115 年第一次 iPAS AI 應用規劃師 初級 科目二 生成式 AI 應用與規劃 第 48 題

查看官方原文 PDF