泛化能力 是什麼?
Generalization — 泛化能力 的完整解釋
泛化能力是指機器學習模型在未見過的數據上表現良好的能力。一個具有良好泛化能力的模型能夠從訓練數據中學習到普遍規律,並應用於新數據。
容易混淆
泛化能力 vs 過擬合 過擬合是只會記訓練資料。 泛化能力是遇到新資料也能表現穩。
泛化能力 vs 欠擬合 欠擬合是連訓練資料都學不好。 泛化能力好,代表學到的是可延伸的規律。
記住這句就好
新資料也能做對,才叫真的學會。
實際案例
圖像分類 模型在訓練集很高分,但換到新拍的照片就錯很多,代表泛化不足。
文本分類 在舊新聞上準,不代表遇到新詞、新事件時還能穩,這就是泛化能力要檢查的地方。
算法與應用
評估泛化能力最常看驗證集、測試集和交叉驗證。 提升方法常包含更多資料、正則化、特徵工程、資料清理和模型簡化。
情境判斷
Q1:如果模型訓練分數高、測試分數低,通常先懷疑什麼? → 常先懷疑過擬合,也就是泛化能力不足。
Q2:如果訓練分數和測試分數都很低,問題還只是泛化嗎? → 不一定,這時更可能是欠擬合或資料本身不足。
相關術語
常見問題
泛化能力可以直接量化嗎?
可以,通常看未見資料上的表現差距。
資料越多就一定泛化越好嗎?
不一定,資料品質和代表性也很重要。
正則化為什麼常被提到?
因為它能抑制過度擬合,幫助泛化。
遷移學習能幫助泛化嗎?
常可以,尤其當目標資料少時。