相關係數 是什麼?
Correlation — 相關係數 的完整解釋
相關係數衡量兩個變數之間線性關係的強度和方向,範圍從 -1 到 1。1 表示完全正相關,-1 表示完全負相關,0 表示沒有線性關係。
容易混淆
相關係數 vs 因果關係 vs 共變異數
相關係數:看關聯的方向和強度,標準化後通常介於 -1 到 1
因果關係:看一個變數是不是造成另一個變數
共變異數:看共同變動方向,但沒有標準化,尺度受單位影響
最關鍵的區別:相關只說一起變,不等於互相造成。
記住這句就好
會一起變,不代表有因果。
實際案例
銷售分析
前:只看到冰淇淋銷量和氣溫一起上升,卻急著下結論
後:先用相關係數看關聯,再進一步檢查是否有其他因素
學習成效
前:以為上課時數和考分一定成正比
後:先看相關,再搭配其他變數判斷是不是還有背景因素影響
算法與應用
相關係數常見形式有皮爾森相關和斯皮爾曼相關,前者看線性關係,後者看單調關係
它常用於探索性資料分析、特徵篩選和假設建立
但它只是起點,不能單靠一個數字就下商業或科學結論
情境判斷
Q1(直覺題): 相關係數接近 1,通常代表兩個變數一起升降得很明顯嗎?
→ 是,代表正相關很強。
Q2(判斷題): 只要相關係數高,就能直接說一個變數造成另一個變數嗎?
→ 不能,這還不夠證明因果。
相關術語
常見問題
相關係數為 0 代表完全沒關係嗎?
不一定,只是代表沒有線性關係,仍可能有非線性關係。
相關係數可以是負的嗎?
可以,代表一個變大時另一個傾向變小。
相關係數要怎麼解讀大小?
要看領域背景,沒有放諸四海皆準的絕對門檻。