---
title: "過擬合（Overfitting）"
slug: overfitting
language: zh-TW
source: https://aiterms.tw/terms/overfitting
updated_at: 2026-04-29
tags: [模型訓練, 模型評估, 機器學習]
ipas_term: true
---

# 過擬合（Overfitting）

> **你有沒有遇過考卷一模一樣會寫，題目一變就卡住的情況？**
>
> 你可以把 過擬合 想成 訓練集背太熟，遇到新題就失準。
>
> 模型要能面對沒看過的新資料，訓練資料背太熟，遇到新資料就失準 這件事就特別重要。
>
> 你可以把它想成一個把抽象概念拉回日常判斷的提示，先知道它解決什麼問題，再看技術細節。

### 容易混淆
> **過擬合 vs 欠擬合**
>
> 過擬合是學太專精，只會訓練集；欠擬合是學太少，連訓練集都學不好，兩者都導致模型泛化能力差，無法處理新資料。
>
> 最關鍵的區別：一個是記太熟，一個是學太少。
>
>
> **過擬合 vs 欠擬合**
>
> 過擬合是學太細，欠擬合是學太少，兩邊都會讓泛化變差
>
> 最關鍵的區別：一個記太多，一個學太少。

### 記住這句就好
> 訓練資料背太熟，遇到新資料就失準

### 實際案例
> **案例 1：模型在訓練集接近滿分，到了測試集卻掉到很低**
>
> 這種情況下，過擬合 會幫你把原本手工或靠直覺的步驟變得更穩。
>
>
> **案例 2：小資料配大模型，最後只學到雜訊沒有學到規律**
>
> 另一個常見場景也能看出 過擬合 的價值，因為它處理的是同一種核心問題。

### 算法與應用
> 核心意思就是：訓練資料背太熟，遇到新資料就失準。
>
> 常見解法包含正則化、Dropout、早停、交叉驗證和增加資料
>
> 看訓練分數和驗證分數的落差，最容易先抓到問題

### 情境判斷
> **Q1（直覺題）：** 模型在訓練集接近滿分，到了測試集卻掉到很低 這種情況，會先想到 過擬合 嗎？
>
> → 會，因為它正好在處理這件事的核心問題，只是還要看資料乾不乾淨、流程穩不穩。
>
>
> **Q2（判斷題）：** 訓練分數很好、測試分數很差，一定是過擬合嗎？
>
> → 多半是，但也要看資料切分、標註品質和任務難度，有時是資料分布不同

### iPAS 考題
> **出題方向：** 過擬合 常考概念、應用場景和與相近術語的差別。
>
>
> **Q：如果題目問你「哪個敘述最符合 過擬合？」要先看什麼？**
>
> → 先看它是在解決「訓練資料背太熟，遇到新資料就失準」這件事，還是只是描述相似的工具或流程。

### 常見問題
> **Q：過擬合和欠擬合有什麼不同？**
> 過擬合是指模型在訓練資料上表現很好，但在測試資料上表現很差；欠擬合是指模型在訓練資料和測試資料上都表現很差。
> 過擬合通常是因為模型過於複雜，學習了訓練資料中的雜訊；欠擬合通常是因為模型過於簡單，無法捕捉資料中的重要特徵。
>
> **Q：什麼時候應該使用過擬合？**
> 一般來說，我們應該避免過擬合。
> 但在某些特殊情況下，例如在資料量非常有限的情況下，或者在競賽中只關心特定測試集的表現時，可以適當允許模型過擬合。
> 但是，需要謹慎評估這種做法的風險，並採取相應的措施來控制過擬合的程度。
>
> **Q：初學者學習過擬合最常見的誤解是什麼？**
> 初學者最常見的誤解是認為訓練集準確率越高越好。
> 他們往往會過度追求在訓練集上的完美表現，而忽略了模型的泛化能力。
> 實際上，一個好的模型應該在訓練集和測試集上都表現良好，而不是只在訓練集上表現出色。

### 相關術語
> - **正則化**：看完這個再讀它，會更容易把概念串起來
> - **隨機丟棄**：看完這個再讀它，會更容易把概念串起來
> - **提前終止**：看完這個再讀它，會更容易把概念串起來
> - **交叉驗證**：看完這個再讀它，會更容易把概念串起來
> - **欠擬合**：看完這個再讀它，會更容易把概念串起來

---

來源：https://aiterms.tw/terms/overfitting
快查頁：https://aiterms.tw/terms/overfitting
外部參考：https://ipd.nat.gov.tw/ipas/certification/AIAP/news/ffdba0fcdbda40baadeef2a1bdc0230e
最後更新：2026/04/29
深度解說：https://aiterms.tw/learning/what-is-overfitting