---
title: "資料擴增術（Data Augmentation）"
slug: data-augmentation
language: zh-TW
source: https://aiterms.tw/terms/data-augmentation
updated_at: 2026-04-29
tags: [機器學習, 深度學習, 電腦視覺, 模型訓練, 資料處理, 特徵工程, 模型評估, AI基礎]
ipas_term: false
---

# 資料擴增術（Data Augmentation）

> **你有沒有在你資料太少，想把訓練集變得更有變化時，還在想這件事到底該怎麼看？**
>
> 把它想成對同一份資料做合理變形，做出更多版本。
> 它能增加資料多樣性，讓模型看到更多樣的情況。
> 做得好會提升泛化，做過頭反而會把資料變得不自然。
>
> 你可以把它想成一個把抽象概念拉回日常判斷的提示，先知道它解決什麼問題，再看技術細節。

### 容易混淆
> **synthetic-data**
> vs 收集更多原始資料：收集更多原始資料像找更多不同的模特兒來拍，成本高且耗時；資料擴增術則像把現有模特兒「變花樣」，成本低，但也能有效增加資料多樣性。
> **常見混淆：資料擴增術 vs synthetic-data**
> 擴增是基於原資料做合理變化，合成資料可從零生成。

### 記住這句就好
> 不是亂加資料，是把原有資料變出合理變化。

### 實際案例
> **影像翻轉**
> 把左右翻轉、旋轉或裁切，讓模型不只認一種角度。
> **文本回譯**
> 先翻成另一種語言再翻回來，製造語意接近但說法不同的句子。

### 算法與應用
> 1. 圖像、文字、語音都能做擴增，但方法會不一樣。
> 2. 擴增要保持標籤不變，不然等於把資料弄錯。
> 3. 它常和資料不足、類別不平衡或遷移學習一起使用。

### 情境判斷
> **Q1：你只有少量影像資料，想提升模型穩定度，先想到什麼？**
> → 資料擴增通常是很合理的第一步。
> **Q2：如果擴增後模型反而更差，可能代表什麼？**
> → 很可能擴增方式太激進，已經破壞了原本語意或特徵。

### 常見問題
> **Q：資料擴增一定能提升模型效能嗎？**
> 資料擴增通常能提升模型效能，尤其是在資料量不足的情況下。然而，不當的擴增策略或過度擴增可能導致模型過擬合，反而降低效能。因此，需要根據具體任務和資料集，謹慎選擇和調整擴增策略。
> **Q：有哪些常用的圖像資料擴增方法？**
> 常用的圖像資料擴增方法包括幾何變換（旋轉、縮放、平移、翻轉）、顏色空間變換（調整亮度、對比度、飽和度）、添加雜訊、裁剪、遮擋等。還可以結合多種方法，例如先旋轉再縮放，以增加資料的多樣性。
> **Q：資料擴增在自然語言處理中如何應用？**
> 在自然語言處理中，資料擴增可以通過同義詞替換、隨機插入、隨機刪除、回譯等方法實現。例如，可以使用同義詞詞典將句子中的某些詞替換為其同義詞，或者使用機器翻譯將句子翻譯成另一種語言，然後再翻譯回來，從而生成新的句子。

### 相關術語
> - **合成數據**：看完這個後，再回來看 資料擴增術 會更容易把脈絡接起來。
> - **資料前處理**：看完這個後，再回來看 資料擴增術 會更容易把脈絡接起來。
> - **遷移學習**：看完這個後，再回來看 資料擴增術 會更容易把脈絡接起來。
> - **少樣本學習**：看完這個後，再回來看 資料擴增術 會更容易把脈絡接起來。
> - **穩健性**：看完這個後，再回來看 資料擴增術 會更容易把脈絡接起來。

---

來源：https://aiterms.tw/terms/data-augmentation
快查頁：https://aiterms.tw/terms/data-augmentation
最後更新：2026/04/29
深度解說：https://aiterms.tw/learning/what-is-data-augmentation