---
title: "標籤雜訊（Label Noise）"
slug: label-noise
language: zh-TW
source: https://aiterms.tw/terms/label-noise
updated_at: 2026-04-29
tags: [機器學習, 模型訓練, 資料處理, 模型評估, 深度學習, 電腦視覺]
ipas_term: false
---

# 標籤雜訊（Label Noise）

> **資料標對了模型才學得對，如果標籤本身就錯了，會發生什麼事？**
>
> 你可以把它想成題目答案寫錯，學生就算很認真也會學歪。
>
> 標籤雜訊是指訓練資料集中不正確或錯誤的標籤。這些錯誤標籤會降低模型效能，導致模型學習到錯誤的模式。
>
> 你可以把它想成一個把抽象概念拉回日常判斷的提示，先知道它解決什麼問題，再看技術細節。

### 容易混淆
> **資料不平衡**
> 標籤雜訊是標錯，資料不平衡是某一類太少，兩者都會讓模型表現變差。
>
> **資料偏見**
> 偏見可能來自資料收集或標註規則，標籤雜訊更直接指錯標。

### 記住這句就好
> 答案錯了，模型再強也會學歪。

### 實際案例
> **圖片標錯類別**
> 貓圖被標成狗，模型會把貓的特徵學到錯誤類別上。
>
> **內容審查**
> 灰色地帶的內容如果標註規則不清，標籤雜訊就會被放大。

### 算法與應用
> 標籤雜訊可能來自人工失誤、規則模糊、群眾標註品質差，或惡意污染。處理方法包含抽樣複查、共識標註、魯棒損失函數和資料清洗。

### 情境判斷
> **Q1（直覺題）：** 如果你現在遇到一個 圖片標錯類別 的場景，這個概念會是第一個想到的工具嗎？
> → 看情況，但如果任務目標和這個概念的用途一致，就很可能是。核心還是先確認你要解決的是分類、分群、壓縮、檢索，還是最佳化。
>
> **Q2（判斷題）：** 如果你把它和 資料偏見 一起用，結果反而變不穩，通常該怎麼想？
> → 看情況。先檢查資料分布、特徵定義和模型假設是否相容，很多時候不是概念本身有問題，而是使用條件不對，像距離尺度沒對齊、標註規則不一致，或輸入格式不合。

### 常見問題
> **Q：標籤雜訊 最容易跟 資料不平衡 混淆嗎？**
> 標籤雜訊是標錯，資料不平衡是某一類太少，兩者都會讓模型表現變差。
>
> **Q：什麼情況會用到 標籤雜訊？**
> 你可以把它想成題目答案寫錯，學生就算很認真也會學歪。 實務上只要你要處理和這個概念相符的任務，就會用到它。
>
> **Q：初學者最常錯在哪裡？**
> 偏見可能來自資料收集或標註規則，標籤雜訊更直接指錯標。

### 相關術語
> - **資料標註**：讀完這個後，接著看它，可以把 標籤雜訊 放回更完整的系統脈絡裡。
> - **準確率**：讀完這個後，接著看它，可以把 標籤雜訊 放回更完整的系統脈絡裡。
> - **偏差**：讀完這個後，接著看它，可以把 標籤雜訊 放回更完整的系統脈絡裡。
> - **穩健性**：讀完這個後，接著看它，可以把 標籤雜訊 放回更完整的系統脈絡裡。

---

來源：https://aiterms.tw/terms/label-noise
快查頁：https://aiterms.tw/terms/label-noise
最後更新：2026/04/29
深度解說：https://aiterms.tw/learning/what-is-label-noise