機率分佈是什麼？

Probability Distribution — 機率分佈的完整解釋

機率分佈描述了隨機變數所有可能取值及其對應的機率。它可以是離散的（例如二項分佈）或連續的（例如常態分佈）。

容易混淆

機率分佈 vs 單一機率值 單一機率值只說某一件事發生多大可能，機率分佈則把所有可能結果一起列出來。前者像看一個點，後者像看整張地圖。最關鍵的區別：一個是局部答案，一個是全貌。

離散分佈 vs 連續分佈 離散分佈處理可數的結果，例如擲骰子、是否成交。連續分佈處理可切得很細的數值，例如身高、等待時間。最關鍵的區別：前者數得完，後者看區間。

記住這句就好

看到一個結果不夠，要看整張可能性地圖。

實際案例

電商缺貨率 客服想知道某個商品下週會不會缺貨，不是只看單一銷量，而是看需求分佈。分佈越集中，庫存越容易估；分佈越分散，補貨就要留更多緩衝。

等待時間 排隊系統想估算顧客平均要等多久，會用等待時間的分佈來看尖峰與尾巴。這比只看平均值更有用，因為少數長等待會直接影響體驗。

算法與應用

離散分佈用機率質量函數，連續分佈用機率密度函數，前者算每個值的機率，後者看區間內的機率。平均數看中心，變異數看散布，兩者一起看，才知道資料是穩還是亂。實務上常先用直方圖觀察形狀，再決定要用哪一種分佈做建模。

情境判斷

Q1（直覺題）： 你要估計一間店每天來客數的可能範圍，該先想什麼？

→ 先想機率分佈，因為你要看的是「各種來客數各有多大機會」，不是只盯著一個平均值。

Q2（判斷題）： 同樣是機率分佈，遇到離散資料和連續資料可以用同一種做法嗎？

→ 不行，資料型態不同，離散資料看每個值的機率，連續資料看區間與密度，模型和圖形都會不一樣。

常見問題

如何判斷資料比較像哪一種分佈？

先看資料型態，再看直方圖、偏態和峰度，必要時再做假設檢定，沒有單一方法可以一眼判定。

機率分佈的參數在做什麼？

參數是在控制分佈的位置、寬窄與形狀，例如常態分佈的平均數和標準差。

為什麼模型訓練要在乎分佈？

因為資料分佈會影響損失函數、抽樣方法和不確定性估計，分佈看錯，後面很多步都會偏掉。

← 回到機率分佈快查頁

機率分佈是什麼？

容易混淆

記住這句就好

實際案例

算法與應用

情境判斷

相關術語

相關術語

常見問題

如何判斷資料比較像哪一種分佈？

機率分佈的參數在做什麼？

為什麼模型訓練要在乎分佈？

機率分佈 是什麼？

容易混淆

記住這句就好

實際案例

算法與應用

情境判斷

相關術語

相關術語

常見問題

如何判斷資料比較像哪一種分佈？

機率分佈的參數在做什麼？

為什麼模型訓練要在乎分佈？

機率分佈是什麼？