Z 分數 是什麼?
Z-score — Z 分數 的完整解釋
衡量一個值偏離平均值幾個標準差,Z = (x - μ) / σ。常用於標準化和異常值檢測
容易混淆
Z 分數 vs 百分位數 Z 分數看的是離平均多遠,百分位數看的是排名在哪裡。
Z 分數 vs T 分數 T 分數是把 Z 分數換成另一種量尺,通常平均 50、標準差 10。
Z 分數 vs 原始數值 原始數值還帶著各自單位,Z 分數把它標準化後,才更容易比較。
最關鍵的區別:Z 分數回答的是「離平均有幾個標準差」。
記住這句就好
正的高於平均,負的低於平均。
實際案例
信用卡異常交易 如果某位客戶平常每筆消費都很穩定,但突然出現一筆遠高於平均的交易,系統可以用 Z 分數先把它標成可疑。
兒童生長評估 醫療上會把身高或體重和同齡參考值比較,Z 分數太低或太高,都可能代表需要進一步觀察。
算法與應用
Z = (x - μ) / σ
這裡 x 是你的數值,μ 是平均值,σ 是標準差。
它常用在標準化、異常偵測、品質管制和統計檢定裡。當數據分布很偏時,Z 分數還是能算,但門檻的解讀就要更小心。
情境判斷
Q1(直覺題): 某班平均 60 分、標準差 5 分,一個學生考 75 分,Z 分數大約是多少?
→ 大約是 3,因為 (75 - 60) / 5 = 3,代表高出平均 3 個標準差。
Q2(判斷題): 如果資料分布明顯右偏,你還能直接把 Z 分數當成唯一的異常判準嗎?
→ 要小心。Z 分數可以算,但偏態很重時,可能要先做轉換或改用更穩健的方法。
相關術語
常見問題
Z 分數為負代表什麼?
代表那個值低於平均,絕對值越大,離平均越遠。
Z 分數要多大才算異常?
沒有絕對門檻,常見會看 \|Z\| > 2 或 \|Z\| > 3,但要依場景調整。
Z 分數一定要常態分佈嗎?
不一定能算,但若要用門檻解讀機率,常態分佈會更好用。
Z 分數能用在非數值資料嗎?
不能直接用,因為它需要平均值和標準差這類數值統計量。