你在看兩個類別變數之間有沒有關聯時,你會怎麼判斷它真正的作用?
你可以把它想成 卡方檢定是一種統計方法,用於檢驗兩個或多個類別變數之間是否存在顯著關聯性。它比較觀察值與期望值之間的差異。
在 你在看兩個類別變數之間有沒有關聯時 這種情境裡,這個概念會直接影響你怎麼設計、怎麼評估、怎麼上線。
容易混淆
卡方檢定 vs t 檢定 卡方檢定看類別變數,t 檢定看連續變數的平均。
卡方檢定 vs 相關係數 卡方檢定是看類別之間是否有關聯,相關係數偏向連續變數的線性關係。
卡方檢定 vs 因果推論 卡方檢定只能看關聯,不能直接推出因果。
記住這句就好
先看它要解決的是什麼問題,再看它是不是最合適的方法。
實際案例
案例 1:廣告點擊 你想知道性別和是否點擊廣告之間有沒有關聯。
案例 2:問卷偏好 你想知道不同年齡層對某產品的偏好分布有沒有差。
算法與應用
面向 重點 核心 把觀察到的次數和期望次數相比,看差異大不大。 前提 資料要是類別型,且各觀察值最好彼此獨立。 注意 期望次數太小時,結果會比較不穩。
情境判斷
Q1(判斷題): 如果兩個變數都是類別型,這時很自然會想到哪個檢定? → 通常會先想到卡方檢定。
Q2(判斷題): 如果你想證明兩件事有因果關係,卡方檢定夠嗎? → 不夠,它只能告訴你有沒有關聯。
常見問題
卡方檢定的虛無假設是什麼?
通常是兩個變數彼此獨立,沒有關聯。
p 值怎麼看?
p 值小於顯著水準時,通常表示關聯不是隨機波動造成的。
樣本太少可以用嗎?
要小心,期望次數過小時不太適合。