線性迴歸的 R² 值 0.85 代表什麼意義?
在線性迴歸模型中,若 R² 值為 0.85,其意義為何?
線性迴歸模型訓練完之後,我們會用一些指標來評估它到底做得好不好。R²(R 平方,也叫決定係數)就是其中一個評估指標,是一個介於 0 和 1 之間的數值。
題目給了一個具體的例子:R² = 0.85,問你這個數字代表什麼意思。
問你:R² = 0.85 在線性迴歸中的正確解釋是什麼?
一句話總結
R² = 0.85 的意義是85% 的資料變異(y 值的波動)可以被這個線性迴歸模型解釋。這不是「準確率 85%」,而是「模型解釋了資料中 85% 的波動,剩餘 15% 屬於模型捕捉不到的因素或隨機誤差」。
先感受問題:為什麼房價不一樣,模型解釋了多少?
「永昌不動產」的資料分析師小玲建了一個線性迴歸模型,用房屋面積來預測台北市的售價。
她發現:台北市的房價差異很大,有人賣 800 萬,有人賣 3000 萬。這些差異(「變異」)是從哪來的?
- 面積大小(她的模型有考量)
- 所在行政區(模型沒加入)
- 樓層、屋齡、裝潢(模型沒加入)
- 買方出價時機、運氣(隨機因素)
模型跑完,R² = 0.85。這代表:光靠「面積」這一個特徵,就能解釋台北市房價差異的 85%,剩餘 15% 的差異是面積之外的因素造成的。
單純觀察均值的問題
- 沒有任何模型時的基準:如果完全忽略面積,只用「所有房子的平均價格」來預測每一間,誤差就是所有資料點和均值的差距,叫做「總變異」(TSS)。
- 模型的貢獻無法量化:加入面積特徵之後,模型的預測和實際值更接近,誤差縮小了。但「縮小了多少比例」需要一個指標來表達。
- 不同規模的問題無法比較:房價的 MSE 和體重的 MSE 單位不同,無法直接比較哪個模型更好。需要一個 0 到 1 之間的無量綱指標。
- 無法判斷模型是否優於最簡單的「猜均值」策略:R² 的設計就是來解決這個問題,以「均值預測」作為基準線,看模型比它好多少。
- 誤差指標(MSE/RMSE)難以直覺解讀:RMSE = 150 萬,這個數字代表什麼程度的好壞?很難直覺判斷,但 R² = 0.85 代表「解釋了 85%」,更直覺。
R² 怎麼量化模型解釋了多少
小玲的線性迴歸模型算出 R² = 0.85,含義是:
模型用面積預測的殘差(實際值與預測值的差異總和 = RSS)比起直接用均值預測的誤差(TSS),縮小了 85%。
換句話說:面積這個特徵「解釋」了台北市房價波動的 85%,讓預測比「猜平均值」準確了 85%。剩餘 15% 的變異是面積無法解釋的——可能是行政區、樓層、或純粹的市場隨機性。
這不代表模型的預測「準確率 85%」,也不代表「誤差 15%」或「信心水準 85%」,這些說法都是對 R² 的誤解。
這就是選項 B 講的:85% 的變異可被模型解釋。
技術版:R² 的公式拆解與正確解讀
中級考試大概率會考程式碼跟公式,所以這部分你還是要學。但如果現在學起來很痛苦,可以先跳過,等讀完其他題目回頭再來。
想像台北市 100 間房子的售價。如果你什麼都不知道,最好的猜測就是「所有房子的平均價格」。這個猜法和實際售價的差距,叫「總差距」。
現在你知道每間房子的面積了。你建了一條迴歸線,用面積來預測售價。這條線和實際售價的差距,叫「剩餘差距」。
R² 就是:(總差距 - 剩餘差距) ÷ 總差距。它回答的問題是:「知道面積之後,我的猜測比純猜均值好了多少比例?」R² = 0.85 就是「好了 85%」。
| 白話說法 | 公式 |
|---|---|
| 總變異(用均值猜的總誤差平方和) | TSS = Σ(yᵢ - ȳ)² |
| 殘差平方和(模型預測的總誤差) | RSS = Σ(yᵢ - ŷᵢ)² |
| 決定係數(模型解釋的比例) | R² = 1 - RSS/TSS |
| R² 的另一種理解 | R² = (TSS - RSS) / TSS |
- yᵢ
- 第 i 間房子的實際售價
- ȳ(y-bar)
- 所有房子的平均售價
- ŷᵢ(y-hat)
- 模型對第 i 間房子的預測售價
- TSS(Total Sum of Squares)
- 總變異:所有實際值和均值的差距平方和,代表「不用模型時的基準誤差」
- RSS(Residual Sum of Squares)
- 殘差平方和:所有實際值和模型預測值的差距平方和
- R²
- 決定係數:1 減去「殘差/總變異」,表示模型解釋了多少比例的變異
小玲的房價資料(簡化版,5 間房子):
實際售價 y: 1000, 1500, 2000, 2500, 3000(萬元)
均值 ȳ = (1000+1500+2000+2500+3000)/5 = 2000
模型預測 ŷ: 1100, 1600, 1900, 2400, 2800(萬元)
TSS = (1000-2000)² + (1500-2000)² + (2000-2000)² + (2500-2000)² + (3000-2000)²
= 1000000 + 250000 + 0 + 250000 + 1000000
= 2500000
RSS = (1000-1100)² + (1500-1600)² + (2000-1900)² + (2500-2400)² + (3000-2800)²
= 10000 + 10000 + 10000 + 10000 + 40000
= 80000
R² = 1 - RSS/TSS = 1 - 80000/2500000 = 1 - 0.032 = 0.968
→ 解釋:面積解釋了 96.8% 的房價變異,模型效果非常好
- R² = 0 代表什麼?模型和「猜均值」有什麼差別?
- R² = 1 代表什麼?是不是代表模型完美無誤?
- 加入更多特徵,R² 一定會升高嗎?(提示:想想過擬合)
- R² 能用在分類問題嗎?還是只適合迴歸?
- Adjusted R²(調整後 R²)為什麼比 R² 更適合比較不同特徵數的模型?
為什麼其他選項是錯的
A模型準確率為 85%
「準確率 85%」通常用於分類問題,代表模型預測正確的樣本比例。
R² 是迴歸問題的指標,衡量的是「模型解釋變異的比例」,不是「預測正確的比例」。迴歸的輸出是連續數值,沒有「對或錯」這種二元判斷,只有「預測值和實際值差多遠」。把 R² 解讀成「準確率」混淆了兩種不同任務的評估邏輯。
從分類問題認識評估指標的人,把「百分之 N = 準確率 N%」的直覺套用到迴歸指標。R² = 0.85 和「分類準確率 85%」雖然數字格式相似,但含義完全不同。
C預測誤差為 15%
看到 R² = 0.85,直覺聯想到「85% 好,15% 不好,所以誤差是 15%」。
1 - R² = 0.15 代表「15% 的變異無法被模型解釋」,不是「預測誤差為 15%」。預測誤差應該用 MSE、RMSE、MAE 等有單位的指標表達(例如:平均誤差 100 萬元),而不是一個無量綱的比例。說「預測誤差 15%」在概念上是混淆了「未解釋變異的比例」和「誤差的量化數值」。
對「R² 的對稱性」有直覺誤解的人。看到 0.85 就自動算出 1 - 0.85 = 0.15,認為這就是誤差,但兩件事根本不是互補關係。
D模型有 85% 的信心水準
信心水準(Confidence Level)是統計假設檢定中的概念,代表我們對某個推論的確信程度(例如 95% 信賴區間)。
R² 和統計推論的「信心水準」完全是兩個不同的概念,屬於不同的統計框架。信心水準通常是固定值(95%、99%),由研究設計決定,不是由 R² 計算出來的。把 R² = 0.85 解讀成「85% 的信心」是張冠李戴。
對「R²」和統計學中的「信心水準」同樣陌生,看到 0.85 這個百分比格式的數字,就聯想到「置信度」的人。這兩個概念雖然都用百分比表示,但屬於不同的評估體系。
同個考點下次怎麼變形
R² = 0 和 R² = 1 各代表什麼?
R² 的邊界值是 0 和 1,這兩個極端情況下模型的行為是什麼?
R² = 0:模型和「猜均值」一樣差,特徵對預測沒有任何幫助,模型毫無解釋力。R² = 1:模型完美預測所有資料點,殘差為 0,每個預測都和實際值完全吻合(通常代表過擬合或測試資料洩漏)。R² 也可以是負數:當模型比「猜均值」還差時,RSS > TSS,R² 就會小於 0。
加入更多特徵,R² 一定會提高嗎?
加入行政區、樓層等特徵,感覺房價應該能被解釋得更好。
是的,在訓練集上加入更多特徵,R² 只會升高或持平,不會降低——因為數學上,多一個特徵至少不會讓 RSS 增加。但這會導致過擬合,在測試集上的 R² 可能下降。這就是為什麼要用「Adjusted R²(調整後 R²)」,它對特徵數量增加有懲罰項,更適合比較不同特徵數的模型。
R² 高就代表模型一定很好嗎?
R² = 0.95 感覺很高,這個模型應該很可靠吧?
不一定。高 R² 可能是過擬合的信號(尤其在訓練集上)。此外,R² 衡量的是「線性關係的解釋力」,如果資料關係是非線性的,高 R² 的線性模型在外推(預測訓練範圍之外的值)時可能失效。R² 也不告訴你預測誤差的絕對大小——R² = 0.85 的模型,平均誤差可能是 100 萬元,也可能是 1000 萬元,要搭配 RMSE 才能判斷實用性。
R² 可以用來評估分類模型嗎?
R² 既然是「解釋比例」,分類問題的預測結果也有正確和錯誤,能套用嗎?
不適用。R² 的公式基於連續數值的「殘差」和「變異」,在分類問題中沒有對應意義。分類問題用準確率、F1 分數、AUC-ROC 等指標。如果強行在分類問題上計算 R²,結果沒有可解釋的含義。
R² 和相關係數(r)是什麼關係?
R² 寫成「R 平方」,是不是就是相關係數 r 的平方?
對,在簡單線性迴歸(只有一個特徵)中,R² 確實等於皮爾森相關係數 r 的平方:R² = r²。相關係數 r 表示特徵 x 和目標 y 的線性相關強度(-1 到 1),r² 代表 x 能解釋 y 的比例(0 到 1)。多元迴歸(多個特徵)中,R² 不等於任何單一相關係數的平方,但概念相同。
想再往下看,這 5 個
- 判定係數(R-squared)本題核心,衡量線性迴歸模型解釋依變數變異比例的指標,範圍 0 到 1,越高代表模型解釋力越強。
- 線性迴歸(Linear Regression)R² 的原生使用場景,用來建立自變數和依變數之間線性關係的模型,R² 是其標準評估指標。
- 均方誤差(Mean Squared Error)和 R² 搭配使用的迴歸評估指標,提供預測誤差的絕對量化值,補足 R² 無法反映誤差實際大小的不足。
- 過擬合(Overfitting)R² 在訓練集上虛高的主要原因,新增特徵雖然提升訓練集 R²,但可能讓模型在測試集上表現更差。
- 偏差方差權衡(Bias-Variance Tradeoff)解釋為什麼高訓練集 R² 不一定代表好的泛化能力,是正確解讀 R² 的理論背景。