梯度提升法 是什麼?
Gradient Boosting — 梯度提升法 的完整解釋
梯度提升法是一種機器學習技術,透過迭代地組合弱學習器(通常是決策樹)來建立強大的預測模型,每次迭代都專注於修正前一個模型的錯誤。
容易混淆
梯度提升法 vs 隨機森林 隨機森林是很多樹一起投票 梯度提升法是樹一棵一棵接著修錯 最關鍵的區別是並行投票,還是序列修正
梯度提升法 vs 提升算法 提升算法是更大的家族 梯度提升法是其中一種實作 最關鍵的區別是家族名稱,還是具體方法
記住這句就好
一棵接一棵修前一棵的錯。
實際案例
信用風險評分 銀行常用梯度提升法來預測借款人會不會違約,因為它在表格資料上通常很強。
需求預測 零售或物流場景裡,梯度提升法可以把天氣、節日、歷史銷量一起納入,逐步修正預測偏差。
算法與應用
它很擅長處理結構化資料,但也比較容易因為樹太深或輪數太多而過擬合。 實務上常要調整學習率、樹深和樹數,讓模型在準確度和穩定度之間取得平衡。
情境判斷
Q1: 你要做表格型預測,資料量中等,想先挑一個常勝方法,會想到什麼? → 梯度提升法通常是很好的起點。
Q2: 模型訓練集表現一直提升,但驗證集開始變差,你該怎麼想? → 可能是樹數太多或樹太深,過擬合開始出現。
相關術語
常見問題
梯度提升法為什麼常很準?
因為它會持續修正前一輪的錯誤,模型會越疊越強。
它一定比隨機森林好嗎?
不一定,資料型態和調參結果都會影響。
什麼時候不適合用?
資料特徵很少、或你更在意快速可解釋時,其他方法可能更省事。