過擬合（Overfitting）是什麼？AI 術語完整說明

Q: 過擬合和欠擬合有什麼不同？

過擬合是指模型在訓練資料上表現很好，但在測試資料上表現很差；欠擬合是指模型在訓練資料和測試資料上都表現很差。 過擬合通常是因為模型過於複雜，學習了訓練資料中的雜訊；欠擬合通常是因為模型過於簡單，無法捕捉資料中的重要特徵。

Q: 什麼時候應該使用過擬合？

一般來說，我們應該避免過擬合。 但在某些特殊情況下，例如在資料量非常有限的情況下，或者在競賽中只關心特定測試集的表現時，可以適當允許模型過擬合。 但是，需要謹慎評估這種做法的風險，並採取相應的措施來控制過擬合的程度。

Q: 初學者學習過擬合最常見的誤解是什麼？

初學者最常見的誤解是認為訓練集準確率越高越好。 他們往往會過度追求在訓練集上的完美表現，而忽略了模型的泛化能力。 實際上，一個好的模型應該在訓練集和測試集上都表現良好，而不是只在訓練集上表現出色。

iPAS 高頻模型訓練模型評估

你有沒有遇過考卷一模一樣會寫，題目一變就卡住的情況？

你可以把過擬合想成訓練集背太熟，遇到新題就失準。

模型要能面對沒看過的新資料，訓練資料背太熟，遇到新資料就失準這件事就特別重要。

你可以把它想成一個把抽象概念拉回日常判斷的提示，先知道它解決什麼問題，再看技術細節。

容易混淆

過擬合 vs 欠擬合

過擬合是學太專精，只會訓練集；欠擬合是學太少，連訓練集都學不好，兩者都導致模型泛化能力差，無法處理新資料。

最關鍵的區別：一個是記太熟，一個是學太少。

過擬合 vs 欠擬合

過擬合是學太細，欠擬合是學太少，兩邊都會讓泛化變差

最關鍵的區別：一個記太多，一個學太少。

記住這句就好

訓練資料背太熟，遇到新資料就失準

實際案例

案例 1：模型在訓練集接近滿分，到了測試集卻掉到很低

這種情況下，過擬合會幫你把原本手工或靠直覺的步驟變得更穩。

案例 2：小資料配大模型，最後只學到雜訊沒有學到規律

另一個常見場景也能看出過擬合的價值，因為它處理的是同一種核心問題。

算法與應用

核心意思就是：訓練資料背太熟，遇到新資料就失準。

常見解法包含正則化、Dropout、早停、交叉驗證和增加資料

看訓練分數和驗證分數的落差，最容易先抓到問題

情境判斷

Q1（直覺題）： 模型在訓練集接近滿分，到了測試集卻掉到很低這種情況，會先想到過擬合嗎？

→ 會，因為它正好在處理這件事的核心問題，只是還要看資料乾不乾淨、流程穩不穩。

Q2（判斷題）： 訓練分數很好、測試分數很差，一定是過擬合嗎？

→ 多半是，但也要看資料切分、標註品質和任務難度，有時是資料分布不同

iPAS 考題

出題方向： 過擬合常考概念、應用場景和與相近術語的差別。

Q：如果題目問你「哪個敘述最符合過擬合？」要先看什麼？

→ 先看它是在解決「訓練資料背太熟，遇到新資料就失準」這件事，還是只是描述相似的工具或流程。

常見問題

過擬合和欠擬合有什麼不同？

過擬合是指模型在訓練資料上表現很好，但在測試資料上表現很差；欠擬合是指模型在訓練資料和測試資料上都表現很差。過擬合通常是因為模型過於複雜，學習了訓練資料中的雜訊；欠擬合通常是因為模型過於簡單，無法捕捉資料中的重要特徵。

什麼時候應該使用過擬合？

一般來說，我們應該避免過擬合。但在某些特殊情況下，例如在資料量非常有限的情況下，或者在競賽中只關心特定測試集的表現時，可以適當允許模型過擬合。但是，需要謹慎評估這種做法的風險，並採取相應的措施來控制過擬合的程度。

初學者學習過擬合最常見的誤解是什麼？

初學者最常見的誤解是認為訓練集準確率越高越好。他們往往會過度追求在訓練集上的完美表現，而忽略了模型的泛化能力。實際上，一個好的模型應該在訓練集和測試集上都表現良好，而不是只在訓練集上表現出色。

範例考題

某團隊訓練影像分類模型，發現模型在訓練資料上的準確率達 98%，但在測試資料上僅有 72%。若團隊希望提升模型對新資料的適應能力，並增加訓練資料的多樣性，下列何者最適合？

A. 增加模型的深度與參數量，使模型學習更多細節
B. 對訓練影像進行旋轉、翻轉等隨機變化 ✓ 正確答案
C. 提高訓練速度，使模型更快完成學習
D. 僅保留模型表現較好的訓練資料

解析：

訓練準確率高但測試準確率低是典型的過擬合（Overfitting）現象。資料增強（Data Augmentation）透過對訓練影像進行旋轉、翻轉等隨機變化，可以增加訓練資料的多樣性，有效降低過擬合。

容易混淆

記住這句就好

實際案例

算法與應用

情境判斷

iPAS 考題

常見問題

相關術語

範例考題

延伸學習

立即測驗

資料來源與參考依據