常態分佈 是什麼?

Normal Distribution — 常態分佈 的完整解釋

常態分佈是一種連續機率分佈,其機率密度函數呈鐘形曲線,平均數、中位數和眾數相等,數據集中在平均值附近。

容易混淆

常態分佈 vs 均勻分佈 常態分佈:中間多、兩邊少 均勻分佈:每個區間機會差不多 最關鍵的區別:先看它是在比什麼,再看它怎麼做。

常態分佈 vs 偏態分佈 常態分佈:左右對稱 偏態分佈:一邊拖尾比較長 最關鍵的區別:先看它是在比什麼,再看它怎麼做。

記住這句就好

大多數值靠中間,少數值在兩邊。

實際案例

身高 成年人的身高常在平均值附近聚集,極端高或極端矮都少。

量測誤差 儀器每次量到的值會微微晃動,常接近常態分佈。

算法與應用

常態分佈由平均數和標準差決定形狀。 很多統計方法之所以好用,就是因為中央極限定理讓它們很常接近常態。 如果資料明顯偏斜,就不能硬當成常態。

情境判斷

Q1(直覺題):你量很多次同一個人的身高,結果大多在平均附近,這像什麼分佈? → 常態分佈。

Q2(判斷題):如果資料一邊很長尾,還能直接當常態嗎? → 不一定,得先看偏態和尾巴長度。

相關術語

常見問題

標準常態分佈是什麼?

就是平均數 0、標準差 1 的常態分佈。

它一定出現在自然界嗎?

不是,但很多獨立誤差加總後會接近它。

為什麼機器學習常看到它?

因為很多模型、評估和誤差分析都會用到。