常態分佈 是什麼?
Normal Distribution — 常態分佈 的完整解釋
常態分佈是一種連續機率分佈,其機率密度函數呈鐘形曲線,平均數、中位數和眾數相等,數據集中在平均值附近。
容易混淆
常態分佈 vs 均勻分佈 常態分佈:中間多、兩邊少 均勻分佈:每個區間機會差不多 最關鍵的區別:先看它是在比什麼,再看它怎麼做。
常態分佈 vs 偏態分佈 常態分佈:左右對稱 偏態分佈:一邊拖尾比較長 最關鍵的區別:先看它是在比什麼,再看它怎麼做。
記住這句就好
大多數值靠中間,少數值在兩邊。
實際案例
身高 成年人的身高常在平均值附近聚集,極端高或極端矮都少。
量測誤差 儀器每次量到的值會微微晃動,常接近常態分佈。
算法與應用
常態分佈由平均數和標準差決定形狀。 很多統計方法之所以好用,就是因為中央極限定理讓它們很常接近常態。 如果資料明顯偏斜,就不能硬當成常態。
情境判斷
Q1(直覺題):你量很多次同一個人的身高,結果大多在平均附近,這像什麼分佈? → 常態分佈。
Q2(判斷題):如果資料一邊很長尾,還能直接當常態嗎? → 不一定,得先看偏態和尾巴長度。
相關術語
常見問題
標準常態分佈是什麼?
就是平均數 0、標準差 1 的常態分佈。
它一定出現在自然界嗎?
不是,但很多獨立誤差加總後會接近它。
為什麼機器學習常看到它?
因為很多模型、評估和誤差分析都會用到。