你想知道一個政策或操作到底有沒有真的造成結果變化時,你會怎麼判斷它真正的作用?
你可以把它想成 因果推論是從觀察數據中推斷因果關係的方法,旨在確定一個變數的變化是否直接導致另一個變數的變化。
在 你想知道一個政策或操作到底有沒有真的造成結果變化時 這種情境裡,這個概念會直接影響你怎麼設計、怎麼評估、怎麼上線。
容易混淆
因果推論 vs 相關性 相關性只說一起變,因果推論要回答改變 X 會不會導致 Y 變。
觀察研究 vs 隨機試驗 觀察研究看現成資料,隨機試驗用設計降低混雜因子。
因果推論 vs 預測模型 預測模型追求準,因果推論追求可解釋的介入效果。
記住這句就好
先看它要解決的是什麼問題,再看它是不是最合適的方法。
實際案例
案例 1:新優惠券 你想知道發券是否真的提升回購,而不是只是剛好買的人比較多。
案例 2:教育介入 你想知道額外輔導課是否真的拉高成績,而不是剛好去上課的學生本來就更認真。
算法與應用
面向 重點 核心 要分辨干擾因素,才能把相關和因果拆開。 常用工具 A/B 測試、DAG、配對、工具變數、差異中的差異。 注意 沒有好設計的觀察資料,很容易把相關誤看成因果。
情境判斷
Q1(判斷題): 看到冰淇淋銷量和溺水率一起升高,能說冰淇淋造成溺水嗎? → 不能,這很可能是氣溫這個混雜因素一起在作用。
Q2(判斷題): 如果 A/B 測試做得很完整,還需要擔心混雜嗎? → 通常比觀察資料少很多,但還是要注意實驗污染和執行偏差。
常見問題
因果推論一定要有實驗嗎?
不一定,但有實驗通常最乾淨;沒有實驗時就要靠嚴謹設計補強。
因果推論和統計檢定是一樣的嗎?
不一樣,檢定只是判斷差異顯著,因果推論要再回答介入效果。
混雜因子是什麼?
它是同時影響 X 和 Y 的第三個因素,會把因果關係搞亂。