---
title: "自動擴展（Auto Scaling）"
slug: auto-scaling
language: zh-TW
source: https://aiterms.tw/terms/auto-scaling
updated_at: 2026-04-29
tags: [模型部署, AI應用, 機器學習, 深度學習, 最佳化, MLOps, AI基礎]
ipas_term: false
---

# 自動擴展（Auto Scaling）

> **網站在促銷時流量突然暴增，平常的伺服器數量撐得住嗎？**
> 你可以把自動擴展想成會看負載調機器數量的系統，忙的時候加人手，閒的時候收回來。
> 它能讓服務在尖峰時不掛掉，在低峰時不浪費資源。
>
> 你可以把它想成一個把抽象概念拉回日常判斷的提示，先知道它解決什麼問題，再看技術細節。

### 容易混淆

> **自動擴展 vs 負載平衡？**
> 自動擴展：依負載自動增減資源
> 負載平衡：把現有流量分散到多台機器
> 最關鍵的區別：擴展是增減容量，平衡是分配現有流量
>
> **水平擴展 vs 垂直擴展？**
> 水平擴展：增加機器數量
> 垂直擴展：升級單台機器規格
> 最關鍵的區別：自動擴展通常以水平擴展最常見
>
> **自動擴展 vs 快取？**
> 自動擴展：根據指標自動動作
> 快取：把熱門資料先存起來
> 最關鍵的區別：快取降低壓力，擴展增加容量，作用不同
### 記住這句就好

> 流量上來加資源，流量下來省成本
### 實際案例

> **購物節尖峰**
> 晚間下單暴增時，平台把 Pod 數量拉高，等活動結束後再縮回來
>
> **夜間批次**
> 凌晨工作量低，系統自動縮小資源，白天再依需求補回來
### 算法與應用

> | 重點 | 你要看什麼 | 為什麼重要 |
> |---|---|---|
> | 指標 | CPU、記憶體、請求數 | 用來判斷現在是不是太忙 |
> | 策略 | 閾值、排程、預測 | 決定何時擴展與縮減 |
> | 風險 | 抖動與冷啟動 | 避免一直加減造成不穩定 |
### 情境判斷

> **Q1：如果 CPU 長時間超過門檻，自動擴展該不該啟動？**
> → 通常該啟動，因為這代表目前容量可能不夠
>
> **Q2：流量忽高忽低時，一直擴展和縮減都很頻繁，這代表什麼？**
> → 代表門檻或冷卻時間可能設太敏感，需要調整策略避免抖動
### 常見問題

> **Q：自動擴展和自動伸縮是一樣嗎？**
> 大致上是同一類概念，實務上常拿來指依負載自動調整資源。
>
> **Q：擴展一定要搭配雲端嗎？**
> 不是，但雲端平台通常最方便做自動化擴縮。
>
> **Q：自動擴展會不會增加成本？**
> 短時間看起來可能會增加，但通常是為了避免更大的故障成本與長期浪費。
### 相關術語

> - **AI負載平衡**：常和流量分配一起設計
> - **模型服務化**：模型服務化後也常要自動擴展
> - **金絲雀部署**：擴容後的新版本常先小流量驗證

---

來源：https://aiterms.tw/terms/auto-scaling
快查頁：https://aiterms.tw/terms/auto-scaling
最後更新：2026/04/29
深度解說：https://aiterms.tw/learning/what-is-auto-scaling