概念漂移 是什麼?
Concept Drift — 概念漂移 的完整解釋
概念漂移是指機器學習模型在部署後,由於資料分佈隨時間變化,導致模型預測準確度下降的現象。需要持續監控並重新訓練模型。
容易混淆
概念漂移 vs 資料漂移 vs 模型退化
概念漂移:資料背後的規則變了
資料漂移:輸入資料的分布變了,但規則不一定變
模型退化:模型表現變差的結果,不一定知道原因
最關鍵的區別:概念漂移說的是「答案規則變了」,不是只有資料長相變了。
記住這句就好
世界變了,模型也要跟著更新。
實際案例
信用卡詐騙偵測
前:模型只認得舊型態詐騙,對新手法反應慢
後:持續監控誤判率,定期用新資料重訓,讓模型跟上攻防變化
商品需求預測
前:去年熱賣的品項,今年不一定還會熱賣
後:加入最新節慶、天氣和促銷資料,讓預測更貼近現況
算法與應用
概念漂移常用監控指標、線上學習、資料分群與定期重訓來處理
產品團隊通常會看準確率、召回率、誤報率和輸入分布是否改變
重點不是只發現變差,而是要知道何時變、怎麼變、以及該怎麼修
情境判斷
Q1(直覺題): 模型最近錯很多,但輸入資料看起來和以前差不多,還會是概念漂移嗎?
→ 有可能。概念漂移看的是資料背後的規則,不是只看表面長相。
Q2(判斷題): 只要把舊模型重新訓練一次,概念漂移就完全消失嗎?
→ 不一定。若環境持續變動,就需要持續監控與更新,而不是重訓一次就結束。
相關術語
常見問題
概念漂移和過擬合有關嗎?
有關聯但不是同一件事,過擬合是學太死,概念漂移是世界本身變了。
怎麼知道模型是不是漂了?
觀察線上指標、抽樣人工檢查,並比較新舊資料分布。
一定要即時重訓嗎?
不一定,要看漂移速度、風險程度和更新成本。