線上學習(Online Learning)是什麼?

線上學習是一種機器學習方法,模型在接收到每個新資料點後立即更新,無需儲存所有資料或進行批次訓練,適用於資料流場景。|本頁含完整原理、應用場景、iPAS 考試重點與 3 個常見問答。

線上學習(Online Learning)是什麼? 機器學習模型訓練

你有沒有看過模型每天都要跟著新資料更新,才不會跟現實脫節?

你可以把 線上學習 想成 有新資料就邊看邊修正。

資料流和需求變化快時比較跟得上,有新資料進來,就邊看邊修正 這件事就特別重要。

你可以把它想成一個把抽象概念拉回日常判斷的提示,先知道它解決什麼問題,再看技術細節。

容易混淆

線上學習 vs 批次學習

批次學習像期末考前才總複習的學生,一次把所有資料學完;線上學習像每天寫作業的學生,有新進度就立刻學,更靈活,適合資料不斷湧入的場景。

最關鍵的區別:一個即時更新,一個集中訓練。

線上學習 vs 批次學習

線上學習邊來邊學,批次學習是一批資料看完再訓練

最關鍵的區別:更新頻率和資料進來的方式不同。

記住這句就好

有新資料進來,就邊看邊修正

實際案例

案例 1:信用卡風控每天吃進交易流,發現新型詐騙就立刻調整

這種情況下,線上學習 會幫你把原本手工或靠直覺的步驟變得更穩。

案例 2:推薦系統根據新點擊紀錄快速修正偏好

另一個常見場景也能看出 線上學習 的價值,因為它處理的是同一種核心問題。

算法與應用

核心意思就是:有新資料進來,就邊看邊修正。

適合串流、即時風控和分布會漂移的場景

要注意災難性遺忘,因為新資料可能把舊知識蓋掉

情境判斷

Q1(直覺題): 信用卡風控每天吃進交易流,發現新型詐騙就立刻調整 這種情況,會先想到 線上學習 嗎?

→ 會,因為它正好在處理這件事的核心問題,只是還要看資料乾不乾淨、流程穩不穩。

Q2(判斷題): 資料分布很穩時,還一定要用線上學習嗎?

→ 看情況,若資料固定且追求穩定,批次學習可能更省心

常見問題

線上學習和批次學習的主要區別是什麼?

線上學習逐個接收資料樣本並即時更新模型,而批次學習則在整個訓練資料集上進行訓練。 線上學習適用於資料流場景,批次學習通常可以獲得更高的準確性。

線上學習有哪些常見的演算法?

常見的線上學習演算法包括隨機梯度下降 (SGD)、被動-積極學習 (Passive-Aggressive Learning)、自適應次梯度方法 (AdaGrad、RMSProp、Adam) 和線上支援向量機 (Online SVM)。

線上學習在哪些實際應用中比較有用?

線上學習在垃圾郵件過濾、股票市場預測、推薦系統、網路安全、物聯網和機器人控制等領域都有廣泛的應用,特別是在資料量大、資料分布不斷變化的場景中。