卡方檢定 是什麼?

Chi-squared Test — 卡方檢定 的完整解釋

卡方檢定是一種統計方法,用於檢驗兩個或多個類別變數之間是否存在顯著關聯性。它比較觀察值與期望值之間的差異。

容易混淆

卡方檢定 vs t 檢定 卡方檢定看類別變數,t 檢定看連續變數的平均。

卡方檢定 vs 相關係數 卡方檢定是看類別之間是否有關聯,相關係數偏向連續變數的線性關係。

卡方檢定 vs 因果推論 卡方檢定只能看關聯,不能直接推出因果。

記住這句就好

先看它要解決的是什麼問題,再看它是不是最合適的方法。

實際案例

案例 1:廣告點擊 你想知道性別和是否點擊廣告之間有沒有關聯。

案例 2:問卷偏好 你想知道不同年齡層對某產品的偏好分布有沒有差。

算法與應用

面向 重點
核心 把觀察到的次數和期望次數相比,看差異大不大。
前提 資料要是類別型,且各觀察值最好彼此獨立。
注意 期望次數太小時,結果會比較不穩。

情境判斷

Q1(判斷題): 如果兩個變數都是類別型,這時很自然會想到哪個檢定? → 通常會先想到卡方檢定。

Q2(判斷題): 如果你想證明兩件事有因果關係,卡方檢定夠嗎? → 不夠,它只能告訴你有沒有關聯。

相關術語

常見問題

卡方檢定的虛無假設是什麼?

通常是兩個變數彼此獨立,沒有關聯。

p 值怎麼看?

p 值小於顯著水準時,通常表示關聯不是隨機波動造成的。

樣本太少可以用嗎?

要小心,期望次數過小時不太適合。