泛化能力（Generalization）是什麼？AI 術語完整說明

Q: 泛化能力可以直接量化嗎？

可以，通常看未見資料上的表現差距。

Q: 資料越多就一定泛化越好嗎？

不一定，資料品質和代表性也很重要。

Q: 正則化為什麼常被提到？

因為它能抑制過度擬合，幫助泛化。

Q: 遷移學習能幫助泛化嗎？

常可以，尤其當目標資料少時。

機器學習模型訓練

你有沒有看過模型在練習題很強，一換新題就掉分？

你可以把泛化能力想成模型把學到的規則用到沒看過資料上的本事，而不是只會背訓練集。

它重要，是因為真正上線後遇到的資料，幾乎都不會和訓練集一模一樣。

你可以把它想成一個把抽象概念拉回日常判斷的提示，先知道它解決什麼問題，再看技術細節。

容易混淆

泛化能力 vs 過擬合 過擬合是只會記訓練資料。泛化能力是遇到新資料也能表現穩。

泛化能力 vs 欠擬合 欠擬合是連訓練資料都學不好。泛化能力好，代表學到的是可延伸的規律。

記住這句就好

新資料也能做對，才叫真的學會。

實際案例

圖像分類 模型在訓練集很高分，但換到新拍的照片就錯很多，代表泛化不足。

文本分類 在舊新聞上準，不代表遇到新詞、新事件時還能穩，這就是泛化能力要檢查的地方。

算法與應用

評估泛化能力最常看驗證集、測試集和交叉驗證。提升方法常包含更多資料、正則化、特徵工程、資料清理和模型簡化。

情境判斷

Q1： 如果模型訓練分數高、測試分數低，通常先懷疑什麼？

常先懷疑過擬合，也就是泛化能力不足。

Q2： 如果訓練分數和測試分數都很低，問題還只是泛化嗎？

不一定，這時更可能是欠擬合或資料本身不足。

常見問題

泛化能力可以直接量化嗎？

可以，通常看未見資料上的表現差距。

資料越多就一定泛化越好嗎？

不一定，資料品質和代表性也很重要。

正則化為什麼常被提到？

因為它能抑制過度擬合，幫助泛化。

遷移學習能幫助泛化嗎？

常可以，尤其當目標資料少時。

範例考題

資料科學團隊在模型訓練前，需對數值特徵進行正規化（Normalization）或標準化（Standardization）。為確保模型評估結果具真實性並避免資料洩漏（Data Leakage），下列何者為最適當的作法？

A. 於資料分割前，先對完整資料集計算統計量並進行標準化處理
B. 先分割訓練資料（Training Data）和測試資料（Test Data），並各自獨立計算統計量後進行標準化
C. 先分割訓練資料（Training Data）和測試資料（Test Data），僅以訓練資料計算統計量，再套用至測試資料 ✓ 正確答案
D. 僅對訓練資料（Training Data）進行標準化處理，測試資料（Test Data）保持原始數值

解析：

為避免資料洩漏，應先分割資料，再僅使用訓練資料計算標準化的統計量（如均值、標準差），然後將相同的統計量套用到測試資料上。這樣測試資料的評估才能真實反映模型的泛化能力。

某零售企業在建置機器學習模型預測顧客購買機率時，資料同時包含大量稀疏類別特徵與數值型特徵。團隊希望模型既能學習過去已出現的特徵組合規律，也能對未出現的特徵組合做出合理預測。下列哪一種模型架構最適合此類需求？

A. 線性迴歸（Linear Regression）
B. 決策樹（Decision Tree）
C. 支援向量機（Support Vector Machine, SVM）
D. 寬深模型（Wide and Deep） ✓ 正確答案

解析：

寬深模型（Wide and Deep）結合了 Wide 部分（記憶已見特徵組合）和 Deep 部分（泛化到未見組合）的優勢，特別適合同時處理稀疏類別特徵和數值型特徵，且能兼顧記憶與泛化能力。