概念漂移(Concept Drift)是什麼?

概念漂移是指機器學習模型在部署後,由於資料分佈隨時間變化,導致模型預測準確度下降的現象。需要持續監控並重新訓練模型。|本頁含完整原理、應用場景、iPAS 考試重點與 3 個常見問答。

概念漂移(Concept Drift)是什麼? 機器學習模型部署

你有沒有遇過模型一開始很準,過幾個月卻突然失準?

你可以把概念漂移想成「世界變了,模型還停在舊答案」:今天的資料分布和以前不一樣,模型原本學到的規則就不一定還對。

這很重要,因為真實世界會變,像消費習慣、詐騙手法、疾病型態都會變,模型如果不更新,就會慢慢失去價值。

容易混淆

概念漂移 vs 資料漂移 vs 模型退化

概念漂移:資料背後的規則變了

資料漂移:輸入資料的分布變了,但規則不一定變

模型退化:模型表現變差的結果,不一定知道原因

最關鍵的區別:概念漂移說的是「答案規則變了」,不是只有資料長相變了。

記住這句就好

世界變了,模型也要跟著更新。

實際案例

信用卡詐騙偵測

前:模型只認得舊型態詐騙,對新手法反應慢

後:持續監控誤判率,定期用新資料重訓,讓模型跟上攻防變化

商品需求預測

前:去年熱賣的品項,今年不一定還會熱賣

後:加入最新節慶、天氣和促銷資料,讓預測更貼近現況

算法與應用

概念漂移常用監控指標、線上學習、資料分群與定期重訓來處理

產品團隊通常會看準確率、召回率、誤報率和輸入分布是否改變

重點不是只發現變差,而是要知道何時變、怎麼變、以及該怎麼修

情境判斷

Q1(直覺題): 模型最近錯很多,但輸入資料看起來和以前差不多,還會是概念漂移嗎?

→ 有可能。概念漂移看的是資料背後的規則,不是只看表面長相。

Q2(判斷題): 只要把舊模型重新訓練一次,概念漂移就完全消失嗎?

→ 不一定。若環境持續變動,就需要持續監控與更新,而不是重訓一次就結束。

常見問題

概念漂移和過擬合有關嗎?

有關聯但不是同一件事,過擬合是學太死,概念漂移是世界本身變了。

怎麼知道模型是不是漂了?

觀察線上指標、抽樣人工檢查,並比較新舊資料分布。

一定要即時重訓嗎?

不一定,要看漂移速度、風險程度和更新成本。