你看到一份報表時,會不會先想知道整體長相和分布? 你可以把 描述性統計 想成資料報表的快速體檢。 它其實就是先用平均數、中位數、離散程度和圖表,把資料長相說清楚。 描述性統計使用數值摘要(平均數、中位數、標準差等)和圖表來描述資料集的集中趨勢、離散程度與分佈型態,是資料分析的第一步。先看輪廓再往下挖,通常比一開始就談模型更穩。
容易混淆
描述性統計 vs 常見誤用場景 它常被拿去跟很像的概念混在一起,但真正差別要回到它處理的是「判斷、生成、分組」還是「保護、壓縮、訓練」。
最關鍵的區別: 先看它是在做「理解、生成、分組、保護」哪一件事,再看細節。
記住這句就好
先把資料的樣貌整理清楚,再談推論
實際案例
案例一:描述性統計 看銷售報表 你先看平均銷售額,再看中位數和標準差,就能知道資料是不是被少數超高訂單拉歪。
案例二:描述性統計 觀察班級成績 如果大部分人都集中在 70 分附近,但有幾個極端值,圖表和分布形狀會比單一平均數更誠實。
深入了解
描述性統計不負責預言未來,它負責把現在的資料講清楚 你先看集中趨勢,再看離散程度和分布形狀,通常就能抓到資料的大問題 如果這一步沒做,後面模型常會在錯的基礎上努力
描述性統計 真正重要的,不是名詞本身,而是它幫你解決的是哪一類問題。
情境判斷
Q1(直覺題): 拿到一份資料表,第一眼最該看的通常是什麼? → 先看平均數、中位數、標準差和圖形分布,先把資料長相認出來。
Q2(判斷題): 只看平均數就能判斷資料狀況嗎? → 不行,因為平均數會掩蓋離群值和分布偏態,還要一起看中位數、離散程度和圖表。
iPAS 考題
Q:描述性統計最核心是在做什麼? 它是在把資料的中心、散布和形狀整理出來,讓你先知道資料長什麼樣。
Q:考題常怎麼問? 常問平均數、中位數、標準差、變異數和分布圖各自代表什麼。
常見問題
描述性統計和推論統計有什麼不同?
描述性統計只是在整理和描述資料本身,例如平均數、中位數、標準差和圖表,推論統計才是從樣本去推估母體或做假設檢定。
只看平均數夠嗎?
不夠,因為平均數很容易被極端值影響,還要一起看中位數、離散程度和分布形狀。
描述性統計一定要用公式嗎?
不一定,很多時候先看圖表就能抓到大方向,公式只是把圖上看到的特徵用數字表達出來。