iPAS AI 應用規劃師中級　科目一

模型預測準確率慢慢下降但沒有報錯，MLOps 該怎麼主動偵測？

原題 46

某企業的 AI 模型已部署於線上服務環境中，用於即時預測顧客流失機率。近期團隊注意到模型預測準確率逐漸下降，但系統運作正常且未出現錯誤訊息。經分析發現，近期輸入資料的分佈與模型訓練資料相比出現顯著偏移。若要在 MLOps 流程中主動偵測並預警此類問題，最應採用下列哪項措施？

白話

一家企業把 AI 模型部署到線上，用來即時預測顧客會不會流失。最近發現準確率慢慢在下降，但系統沒有報任何錯誤。去查才發現，最近進來的資料和當初訓練模型時的資料分佈差很多了。

問你：要在 MLOps（機器學習維運，Machine Learning Operations）流程裡「主動偵測並預警」這種問題，最應該採用哪個措施？

點選你的答案。

← 回 50 題列表回 iPAS 備考總覽

01　總結

一句話總結

模型準確率下降但沒有系統報錯，根本原因是「資料分佈偏移了」。要主動偵測這個問題，就必須建立資料漂移（Data Drift）和概念漂移（Concept Drift）的即時監測機制，這是 MLOps 流程中應對分佈偏移的標準做法。

02　情境

先感受問題：系統沒報錯，但模型已經悄悄失靈

假設「遠傳電信」的資料科學團隊在 2024 年 Q1 訓練了一個流失預測模型，在當時的測試集上準確率 94%，正式上線。

到了 2025 年 Q1，有幾件事悄悄改變了：

行為變化：5G 資費方案降價，大量用戶轉換方案，通話行為改變
人口結構：大量銀髮族用戶加入，使用模式和原訓練資料差很多
外部事件：某競爭對手推出超低價方案，流失原因和當初完全不同

模型沒有壞掉，伺服器正常運作，每分鐘還是輸出預測結果。但輸出的結果越來越不準，因為模型學的是「2024 年 Q1 的世界」，現在進來的卻是「2025 年 Q1 的世界」。

最可怕的是：工程師不一定知道這件事正在發生。系統沒有報錯，沒有異常日誌，只有業務端的人發現「怎麼客服說要離開的客戶，模型說不會流失」。等到業務發現，可能已經損失幾個月的精準度了。

MLOps 要做的就是：在業務發現之前，讓系統自己先「感覺到」資料長相已經和訓練時不一樣了，自動發出警報。

03　對照

為什麼「等到準確率掉了才知道」是被動且危險的

沒有漂移監測機制的 MLOps 流程有五個盲點：

準確率指標是滯後指標：要計算準確率，需要知道「正確答案」。流失預測的正確答案是「30 天後這個用戶有沒有真的流失」。等真實標籤回來再算準確率，已經是 30 天後的事了，早就損失一個月的精準度。
沒有標籤就看不出問題：在很多場景，真實標籤不會即時回來（或很久之後才有），完全依賴準確率指標監控是不夠的。需要看「輸入資料本身有沒有變化」，這不需要等標籤。
系統日誌看不出分佈偏移：系統日誌只記錄服務是否正常（回應時間、錯誤率），不記錄輸入資料的統計特性。工程師每天看日誌，看不到分佈偏移正在發生。
業務影響已發生才發現：通常是業務端的人察覺「預測越來越不準」才回頭問工程師，這時候已經損失一段時間的決策品質。
找出根本原因困難：沒有歷史漂移紀錄，很難說清楚「是從哪時候開始偏的」「是哪些特徵偏移最嚴重」，重訓也不知道從哪個時間點的資料開始抓。

04　解法

即時漂移監測機制：讓系統自己「感覺到」資料在變

回到「遠傳電信」。正確的 MLOps 做法是建立兩層監測：

第一層：資料漂移（Data Drift）監測。持續比較「現在進來的輸入資料分佈」和「訓練時的參考資料分佈」：

監測特徵：月租費金額分佈、通話時數分佈、最後一次客服投訴距今天數、方案類型比例
比較方法：用 PSI（Population Stability Index，族群穩定性指數）或 KS 檢定（Kolmogorov-Smirnov Test）
告警條件：某特徵的 PSI 超過 0.2，代表分佈出現顯著偏移，立刻發警報

第二層：概念漂移（Concept Drift）監測。當真實標籤回來時，比較「同樣的輸入 X，輸出 Y 的對應關係有沒有改變」：

例如：「通話時數低於 100 分鐘」原本強烈預示流失，但現在因為訊息取代通話，低通話時數不再是流失信號
監測方法：追蹤各特徵的 SHAP 值（特徵重要性）隨時間的變化，若某特徵的重要性大幅改變，可能是概念漂移

兩層監測結合，就能在業務發現之前先偵測到問題，觸發警報通知工程師，啟動重訓或人工審核流程。

這就是選項 A 講的：建立即時的資料漂移（Data Drift）與概念漂移（Concept Drift）監測機制。

技術版：Data Drift 和 Concept Drift 的監測指標與工具

本題沒有程式碼，但相關技術背景值得知道。

Data Drift（資料漂移）的定義：輸入資料的統計分佈 P(X) 隨時間改變，但 X 和 Y 的關係 P(Y|X) 不變。例如用戶平均月租費從 499 元漲到 799 元，但「月租費高的用戶流失率低」這個規律不變。Data Drift 讓模型看到的輸入超出訓練分佈範圍，預測能力下降。

Concept Drift（概念漂移）的定義：X 和 Y 的關係 P(Y|X) 改變了，代表判斷標準本身過時了。例如原本「客服投訴次數多 = 高流失風險」，但現在競爭對手降價，就算沒投訴的用戶也大量流失。Concept Drift 更嚴重，可能需要重新定義標籤或訓練策略。

常用的偵測指標：PSI（Population Stability Index）：比較訓練期和上線後各特徵的分佈差異；PSI 小於 0.1 穩定，0.1 到 0.2 要關注，超過 0.2 建議重訓。KS 檢定（Kolmogorov-Smirnov Test）：統計學方法，直接檢驗兩個分佈是否顯著不同，有 p-value 可以設信心水準。JS 散度（Jensen-Shannon Divergence）：衡量兩個分佈的相似程度，0 代表完全相同，1 代表完全不同。

MLOps 工具：常用的開源工具包括 Evidently AI（自動生成資料漂移報告）、WhyLogs（輕量串流監控）、Great Expectations（資料品質驗證）。雲端平台如 AWS SageMaker Model Monitor、Google Vertex AI Model Monitoring 也提供開箱即用的漂移偵測功能。

SHAP 追蹤 Concept Drift：SHAP（SHapley Additive exPlanations）值能解釋每個特徵對每筆預測的貢獻程度。隨時間追蹤各特徵 SHAP 值的分佈變化，若某特徵的重要性排名大幅改變，很可能是 P(Y|X) 已經改變，是 Concept Drift 的信號。

05　陷阱

為什麼其他選項是錯的

B將模型轉換為量化版本以降低延遲

字面在說什麼

把模型做量化（Quantization），把權重從浮點數（float32）壓縮成更小的格式（int8），讓推論速度更快、延遲更低。

為什麼不對

量化是效能最佳化工具，解決「推論太慢」的問題，和「資料分佈偏移導致預測不準」完全沒有關係。題目說系統運作正常，不是推論太慢的問題；問題是資料偏移讓模型失準，量化不能偵測也不能解決分佈偏移。

誰會選錯

看到「線上服務」「即時預測」就聯想到「要降低延遲」的考生。延遲優化是合理的 MLOps 關注點，但不是這個情境的問題所在。題目明確說「準確率逐漸下降」「資料分佈偏移」，這是精準度問題，不是速度問題。

C增加模型超參數調整次數以強化適應性

字面在說什麼

多做超參數調整（Hyperparameter Tuning），讓模型找到更好的參數組合，對各種情況更有適應性。

為什麼不對

超參數調整是在訓練期做的事，調完之後模型就固定了。上線後模型的超參數不會自動隨資料分佈變化而調整。而且調超參數是在舊分佈的資料上做的，對新分佈的適應性沒有幫助。更根本的是：這個措施是被動的（在發現問題後才重新調），不是「主動偵測並預警」。

誰會選錯

把「強化適應性」和「解決分佈偏移」混在一起的考生。超參數調整確實能讓模型在舊分佈上更優化，但無法讓它「主動感知到新分佈已經來了」。主動偵測需要監測機制，不是再多調幾輪超參數。

D使用固定隨機種子（Random Seed）確保訓練穩定

字面在說什麼

設定固定的隨機種子，讓每次訓練都能完全重現，確保訓練過程穩定可預期。

為什麼不對

固定隨機種子解決的是「訓練的可重現性（Reproducibility）」問題，讓同樣的程式碼跑出同樣的結果。這和「上線後資料分佈偏移導致準確率下降」毫無關係。即使訓練 100% 可重現，如果資料偏移了，重新訓練出來的模型在新分佈上依然可能失準。固定隨機種子是工程規範，不是監測工具。

機器學習維運（MLOps）把模型開發、部署、監控、重訓整合為可持續工程流程；主動偵測資料漂移是 MLOps 防止模型靜默退化的核心功能。
資料漂移（Data Drift）模型上線後輸入分佈 P(X) 隨時間偏移；系統運作正常但準確率下降，正是資料漂移的典型表現，PSI 或 KS 檢定可量化嚴重程度。
概念漂移（Concept Drift）P(Y|X) 改變代表判斷規則本身過時；比資料漂移更嚴重，需要重新採集標注資料重訓，而非只監控輸入分佈即可。
模型監控（Model Monitoring）持續追蹤上線模型的資料品質、輸入分佈、輸出分佈與效能指標；是本題「主動偵測並預警」要求的核心技術手段。
異常偵測（Anomaly Detection）識別偏離正常模式的樣本；在模型監控中，輸入資料異常分佈是最早期的警訊，可在準確率指標滯後前先發現問題。