卡方檢定(Chi-squared Test)是什麼?

卡方檢定是一種統計方法,用於檢驗兩個或多個類別變數之間是否存在顯著關聯性。它比較觀察值與期望值之間的差異。|本頁含完整原理、應用場景、iPAS 考試重點與 3 個常見問答。

卡方檢定(Chi-squared Test)是什麼? 統計方法模型評估

你在看兩個類別變數之間有沒有關聯時,你會怎麼判斷它真正的作用?

你可以把它想成 卡方檢定是一種統計方法,用於檢驗兩個或多個類別變數之間是否存在顯著關聯性。它比較觀察值與期望值之間的差異。

在 你在看兩個類別變數之間有沒有關聯時 這種情境裡,這個概念會直接影響你怎麼設計、怎麼評估、怎麼上線。

容易混淆

卡方檢定 vs t 檢定 卡方檢定看類別變數,t 檢定看連續變數的平均。

卡方檢定 vs 相關係數 卡方檢定是看類別之間是否有關聯,相關係數偏向連續變數的線性關係。

卡方檢定 vs 因果推論 卡方檢定只能看關聯,不能直接推出因果。

記住這句就好

先看它要解決的是什麼問題,再看它是不是最合適的方法。

實際案例

案例 1:廣告點擊 你想知道性別和是否點擊廣告之間有沒有關聯。

案例 2:問卷偏好 你想知道不同年齡層對某產品的偏好分布有沒有差。

算法與應用

面向 重點
核心 把觀察到的次數和期望次數相比,看差異大不大。
前提 資料要是類別型,且各觀察值最好彼此獨立。
注意 期望次數太小時,結果會比較不穩。

情境判斷

Q1(判斷題): 如果兩個變數都是類別型,這時很自然會想到哪個檢定? → 通常會先想到卡方檢定。

Q2(判斷題): 如果你想證明兩件事有因果關係,卡方檢定夠嗎? → 不夠,它只能告訴你有沒有關聯。

常見問題

卡方檢定的虛無假設是什麼?

通常是兩個變數彼此獨立,沒有關聯。

p 值怎麼看?

p 值小於顯著水準時,通常表示關聯不是隨機波動造成的。

樣本太少可以用嗎?

要小心,期望次數過小時不太適合。