---
title: "機率分佈（Probability Distribution）"
slug: probability-distribution
language: zh-TW
source: https://aiterms.tw/terms/probability-distribution
updated_at: 2026-04-29
tags: [機器學習, 統計方法, AI基礎, 資料處理, 模型評估, 數學基礎, Python程式]
ipas_term: false
---

# 機率分佈（Probability Distribution）

> **你看天氣預報時，會不會不只想知道會不會下雨，還想知道晴天、陰天、下雨各有多大機會？**
>
> 你可以把機率分佈想成一張可能性地圖，告訴你每個結果出現的機率，而不是只看單一答案。
> 它讓你知道資料長什麼樣、模型該怎麼設計、以及不確定性有多大，所以是統計和機器學習的底層語言。

### 容易混淆
> **機率分佈 vs 單一機率值**
> 單一機率值只說某一件事發生多大可能，機率分佈則把所有可能結果一起列出來。
> 前者像看一個點，後者像看整張地圖。
> 最關鍵的區別：一個是局部答案，一個是全貌。
>
> **離散分佈 vs 連續分佈**
> 離散分佈處理可數的結果，例如擲骰子、是否成交。
> 連續分佈處理可切得很細的數值，例如身高、等待時間。
> 最關鍵的區別：前者數得完，後者看區間。

### 記住這句就好
> 看到一個結果不夠，要看整張可能性地圖。

### 實際案例
> **電商缺貨率**
> 客服想知道某個商品下週會不會缺貨，不是只看單一銷量，而是看需求分佈。
> 分佈越集中，庫存越容易估；分佈越分散，補貨就要留更多緩衝。
>
> **等待時間**
> 排隊系統想估算顧客平均要等多久，會用等待時間的分佈來看尖峰與尾巴。
> 這比只看平均值更有用，因為少數長等待會直接影響體驗。

### 算法與應用
> 離散分佈用機率質量函數，連續分佈用機率密度函數，前者算每個值的機率，後者看區間內的機率。
> 平均數看中心，變異數看散布，兩者一起看，才知道資料是穩還是亂。
> 實務上常先用直方圖觀察形狀，再決定要用哪一種分佈做建模。

### 情境判斷
> **Q1（直覺題）：** 你要估計一間店每天來客數的可能範圍，該先想什麼？
>
> → 先想機率分佈，因為你要看的是「各種來客數各有多大機會」，不是只盯著一個平均值。
>
> **Q2（判斷題）：** 同樣是機率分佈，遇到離散資料和連續資料可以用同一種做法嗎？
>
> → 不行，資料型態不同，離散資料看每個值的機率，連續資料看區間與密度，模型和圖形都會不一樣。

### 常見問題
> **Q：如何判斷資料比較像哪一種分佈？**
> 先看資料型態，再看直方圖、偏態和峰度，必要時再做假設檢定，沒有單一方法可以一眼判定。
>
> **Q：機率分佈的參數在做什麼？**
> 參數是在控制分佈的位置、寬窄與形狀，例如常態分佈的平均數和標準差。
>
> **Q：為什麼模型訓練要在乎分佈？**
> 因為資料分佈會影響損失函數、抽樣方法和不確定性估計，分佈看錯，後面很多步都會偏掉。

### 相關術語
> - **常態分佈**：先讀這個，你會更快看懂對稱型資料和標準差的意義。
> - **卜瓦松分佈**：它常拿來描述事件次數，和機率分佈的離散面很接近。
> - **貝氏定理**：把先驗和觀察結果接起來時，常會回頭看分佈。
> - **最大似然估計**：你會用它把分佈參數從資料裡估出來。

---

來源：https://aiterms.tw/terms/probability-distribution
快查頁：https://aiterms.tw/terms/probability-distribution
最後更新：2026/04/29
深度解說：https://aiterms.tw/learning/what-is-probability-distribution