---
title: "模型壓縮（Model Compression）"
slug: model-compression
language: zh-TW
source: https://aiterms.tw/terms/model-compression
updated_at: 2026-04-29
tags: [機器學習, 深度學習, 模型訓練, 模型部署, 最佳化, 神經網路, AI應用, AI基礎, AutoML, MLOps]
ipas_term: false
---

# 模型壓縮（Model Compression）

> **你有沒有碰過模型太大，手機裝不下、伺服器也跑得吃力？**
>
> 你可以把模型壓縮想成，透過剪枝、量化、蒸餾等方法，把模型變小、變快、變省。
> 它重要在於，很多場景不是比誰最大，而是比誰能在有限資源裡維持夠好的效果。
>
> 你可以把它想成一個把抽象概念拉回日常判斷的提示，先知道它解決什麼問題，再看技術細節。

### 容易混淆

> **模型壓縮 vs 混合精度訓練**
>
> 模型壓縮：把模型本身變小或變簡。
> 混合精度訓練：訓練時混著用不同數值精度。
> 最關鍵的區別：前者偏模型變形，後者偏訓練策略。

> **模型壓縮 vs 模型量化**
>
> 模型壓縮：是更大的總稱。
> 模型量化：是壓縮的一種常見方法。
> 最關鍵的區別：前者是家族名，後者是成員之一。

### 記住這句就好

> 把大模型瘦身，換速度和部署彈性。

### 實際案例

> **手機端情緒辨識**
>
> 原本太大的語音模型經過壓縮後，才能放進行動 App 內即時運行。

> **雲端成本下降**
>
> 同樣的分類模型如果被蒸餾得更小，單次推論成本就能明顯下降。

### 算法與應用

> 常見手法有剪枝、量化、知識蒸餾和低秩分解。
> 壓縮不只是縮參數，還要看速度、記憶體和準確率的整體取捨。
> 好的壓縮會盡量保留原模型能力。

### 情境判斷

> **Q1（情境題）：** 如果模型壓縮後準確率只掉一點點，值得嗎？
>
> → 通常值得，尤其在部署空間、延遲或成本壓力很大的時候。

> **Q2（情境題）：** 如果壓縮後模型變很小，但速度沒變快，這正常嗎？
>
> → 有可能。壓縮方法不一定直接改善實際推論時間，還要看硬體和實作。

### 常見問題

> **Q：模型壓縮一定會犧牲準確率嗎？**
>
> 不一定，但通常會有取捨，目標是把損失壓到可接受。

> **Q：它和量化、剪枝、蒸餾的關係是什麼？**
>
> 它們是壓縮裡的常見方法。

> **Q：模型越大就越不需要壓縮嗎？**
>
> 不是。模型越大，越可能需要壓縮來滿足部署限制。

### 相關術語

> - **模型量化**：壓縮最常見的手法之一。
> - **模型剪枝**：另一個重要的瘦身方法。
> - **知識蒸餾**：把大模型能力轉給小模型的做法。
> - **移動網路**：常見的輕量化模型代表。
> - **邊緣人工智慧**：壓縮後常更適合落地。

---

來源：https://aiterms.tw/terms/model-compression
快查頁：https://aiterms.tw/terms/model-compression
最後更新：2026/04/29
深度解說：https://aiterms.tw/learning/what-is-model-compression