---
title: "代價函數（Cost Function）"
slug: cost-function
language: zh-TW
source: https://aiterms.tw/terms/cost-function
updated_at: 2026-04-29
tags: [機器學習, 深度學習, 模型訓練, 模型評估, 最佳化, 神經網路, 統計方法, AI基礎, Python程式, 數學基礎]
ipas_term: false
---

# 代價函數（Cost Function）

> **你有沒有在訓練模型、想知道它到底有沒有變準時，還在想這件事到底該怎麼看？**
>
> 把它想成模型整體成績單上的總分。
> 它會把每筆資料的誤差平均起來，讓你知道模型在整體資料上的表現。
> 訓練演算法就是一直想把這個分數壓低，模型才會慢慢學對。
>
> 你可以把它想成一個把抽象概念拉回日常判斷的提示，先知道它解決什麼問題，再看技術細節。

### 容易混淆
> **objective-function**
> vs 損失函數 (Loss Function)：損失函數像一道單獨的「考題分數」，它只衡量模型在一個樣本上的預測錯誤程度；代價函數則是所有考題分數的「平均值」，它提供一個整體性的指標，告訴你模型在整個訓練集上的平均表現如何，是模型優化的最終目標。
> **常見混淆：代價函數 vs objective-function**
> 目的函數看的是整體要最小化或最大化的目標，代價函數是其中用來衡量誤差的核心部分。

### 記住這句就好
> 看整體平均誤差，不是只看一題。

### 實際案例
> **垃圾信分類**
> 每封信都有一個誤差，代價函數把整批信件的誤差平均後，讓模型知道要往哪裡修正。
> **房價預測**
> 模型對每個房子的預測都會有偏差，代價函數把偏差統整成一個數字。

### 算法與應用
> 1. 損失函數看單筆資料，代價函數看整個資料集的平均結果。
> 2. 梯度下降會依照代價函數的變化方向更新參數，讓總誤差慢慢下降。
> 3. 如果代價函數設計不對，模型可能學得很慢，或是學到不符合任務目標的方向。

### 情境判斷
> **Q1：模型在某一筆資料上錯很多，但整體平均誤差不高，這代表什麼？**
> → 代表單筆表現可能不好，但整體訓練目標還算穩定，要再看是不是少數樣本特別難。
> **Q2：如果代價函數下降很慢，你會先懷疑什麼？**
> → 先看學習率、特徵尺度和損失設計，因為這些都會影響下降速度。

### 常見問題
> **Q：代價函數和損失函數有什麼區別？**
> 損失函數衡量的是單個樣本的預測誤差，而代價函數衡量的是整個訓練集上的平均誤差。代價函數是所有訓練樣本損失函數的平均值或總和，用於評估模型的整體性能。
> **Q：為什麼代價函數需要可微分？**
> 為了使用梯度下降等優化算法，代價函數通常需要是可微分的。可微分性允許我們計算代價函數對模型參數的梯度，並利用梯度信息來更新參數，從而最小化代價函數。
> **Q：如何防止過擬合？**
> 可以使用正則化等方法來防止過擬合。正則化通過在代價函數中添加正則化項，限制模型參數的大小，從而提高模型的泛化能力。此外，還可以使用交叉驗證等技術來評估模型的泛化能力。

### 相關術語
> - **損失函數**：看完這個後，再回來看 代價函數 會更容易把脈絡接起來。
> - **目標函數**：看完這個後，再回來看 代價函數 會更容易把脈絡接起來。
> - **梯度下降**：看完這個後，再回來看 代價函數 會更容易把脈絡接起來。
> - **正則化**：看完這個後，再回來看 代價函數 會更容易把脈絡接起來。
> - **模型參數**：看完這個後，再回來看 代價函數 會更容易把脈絡接起來。

---

來源：https://aiterms.tw/terms/cost-function
快查頁：https://aiterms.tw/terms/cost-function
最後更新：2026/04/29
深度解說：https://aiterms.tw/learning/what-is-cost-function