---
title: "集成學習（Ensemble Learning）"
slug: ensemble-learning
language: zh-TW
source: https://aiterms.tw/terms/ensemble-learning
updated_at: 2026-04-29
tags: [機器學習, 模型訓練, 模型評估, 最佳化, 統計方法, iPAS中級]
ipas_term: false
---

# 集成學習（Ensemble Learning）

> **你有沒有遇過幾個人各自判斷普通，但湊在一起反而更準？**
> 你可以把集成學習想成，把多個模型的意見合在一起，讓整體判斷比單一模型更穩。
> 它其實就是透過投票、平均或再學一次的方式，把多個弱學習器變成一個更強、更不容易翻車的系統。
>
> 你可以把它想成一個把抽象概念拉回日常判斷的提示，先知道它解決什麼問題，再看技術細節。

### 容易混淆
> **集成學習 vs 單一模型**
> 單一模型靠自己做全部判斷，集成學習則是讓多個模型一起出手。
>
> **Bagging vs Boosting**
> Bagging 是平行訓練再投票，Boosting 是依序修正前一輪錯誤。
>
> **Bagging vs Stacking**
> Bagging 直接投票或平均，Stacking 會再訓練一個元學習器來整合各模型輸出。
>
> **最關鍵的區別：** 先看模型是「一起投票」、還是「一輪一輪改錯」、或是「再交給第二層模型統整」。

### 記住這句就好
> 多個模型一起想，通常比單打獨鬥穩。

### 實際案例
> **案例一：垃圾郵件過濾**
> 一個模型可能會被某些新型垃圾信騙過，但把文字分類器、規則模型和樹模型一起合併，誤判率通常會下降。
>
> **案例二：信用風險評估**
> 銀行做風險分數時，常會把多種模型結果一起考慮，因為不同模型對不同特徵的敏感度不一樣。

### 算法與應用
> 集成學習常見三條路線。Bagging 透過重抽樣和投票降低方差，Random Forest 就是很典型的例子。Boosting 透過連續修正錯誤提高準確率，但也更容易把資料學太死。Stacking 會把多個模型的輸出再交給第二層模型學習，適合想把不同模型特性一起吃進來的場景。

### 情境判斷
> **Q1（直覺題）：** 你有三個分類器，最後用多數決決定答案，這算不算集成學習？
>
> → 算，因為集成學習最基本的精神就是把多個模型的結果整合在一起。
>
> **Q2（判斷題）：** 你的單一模型已經很強了，還要不要硬做集成？
>
> → 看情況。若資料量不大、延遲要求高，集成可能太重；若你最在意穩定度和泛化，集成常常值得。重點是成本和收益要一起看。

### 常見問題
> **Q：Bagging 和 Boosting 有什麼區別？**
> Bagging 是把多個模型平行訓練後做平均或投票，Boosting 則是依序訓練，每一輪都試著修正前一輪的錯誤。
>
> **Q：什麼是元學習器？在 Stacking 中扮演什麼角色？**
> 元學習器是第二層模型，專門學怎麼整合第一層模型的輸出，讓整體預測更準。
>
> **Q：如何避免集成學習中的過擬合？**
> 可以控制基模型複雜度、限制樹深、增加交叉驗證，或避免把太多高度相似的模型硬塞在一起。

### 相關術語
> - **自助聚合**：讀完這個再看它，可以理解平行抽樣和投票的來源
> - **提升算法**：讀完這個再看它，可以理解一輪一輪修正錯誤的做法
> - **隨機森林**：Bagging 最常見的實戰範例
> - **決策樹**：很多集成方法都以它作為基礎模型
> - **偏差方差權衡**：讀完這個再看它，可以理解為什麼集成常能提升泛化

---

來源：https://aiterms.tw/terms/ensemble-learning
快查頁：https://aiterms.tw/terms/ensemble-learning
最後更新：2026/04/29
深度解說：https://aiterms.tw/learning/what-is-ensemble-learning