你有沒有看過模型每天都要跟著新資料更新,才不會跟現實脫節?
你可以把 線上學習 想成 有新資料就邊看邊修正。
資料流和需求變化快時比較跟得上,有新資料進來,就邊看邊修正 這件事就特別重要。
你可以把它想成一個把抽象概念拉回日常判斷的提示,先知道它解決什麼問題,再看技術細節。
容易混淆
線上學習 vs 批次學習
批次學習像期末考前才總複習的學生,一次把所有資料學完;線上學習像每天寫作業的學生,有新進度就立刻學,更靈活,適合資料不斷湧入的場景。
最關鍵的區別:一個即時更新,一個集中訓練。
線上學習 vs 批次學習
線上學習邊來邊學,批次學習是一批資料看完再訓練
最關鍵的區別:更新頻率和資料進來的方式不同。
記住這句就好
有新資料進來,就邊看邊修正
實際案例
案例 1:信用卡風控每天吃進交易流,發現新型詐騙就立刻調整
這種情況下,線上學習 會幫你把原本手工或靠直覺的步驟變得更穩。
案例 2:推薦系統根據新點擊紀錄快速修正偏好
另一個常見場景也能看出 線上學習 的價值,因為它處理的是同一種核心問題。
算法與應用
核心意思就是:有新資料進來,就邊看邊修正。
適合串流、即時風控和分布會漂移的場景
要注意災難性遺忘,因為新資料可能把舊知識蓋掉
情境判斷
Q1(直覺題): 信用卡風控每天吃進交易流,發現新型詐騙就立刻調整 這種情況,會先想到 線上學習 嗎?
→ 會,因為它正好在處理這件事的核心問題,只是還要看資料乾不乾淨、流程穩不穩。
Q2(判斷題): 資料分布很穩時,還一定要用線上學習嗎?
→ 看情況,若資料固定且追求穩定,批次學習可能更省心
常見問題
線上學習和批次學習的主要區別是什麼?
線上學習逐個接收資料樣本並即時更新模型,而批次學習則在整個訓練資料集上進行訓練。 線上學習適用於資料流場景,批次學習通常可以獲得更高的準確性。
線上學習有哪些常見的演算法?
常見的線上學習演算法包括隨機梯度下降 (SGD)、被動-積極學習 (Passive-Aggressive Learning)、自適應次梯度方法 (AdaGrad、RMSProp、Adam) 和線上支援向量機 (Online SVM)。
線上學習在哪些實際應用中比較有用?
線上學習在垃圾郵件過濾、股票市場預測、推薦系統、網路安全、物聯網和機器人控制等領域都有廣泛的應用,特別是在資料量大、資料分布不斷變化的場景中。