iPAS AI 應用規劃師 中級 科目三 機器學習技術與應用

線性迴歸的 R² 值 0.85 代表什麼意義?

原題 15

在線性迴歸模型中,若 R² 值為 0.85,其意義為何?

白話

線性迴歸模型訓練完之後,我們會用一些指標來評估它到底做得好不好。R²(R 平方,也叫決定係數)就是其中一個評估指標,是一個介於 0 和 1 之間的數值。

題目給了一個具體的例子:R² = 0.85,問你這個數字代表什麼意思。

問你:R² = 0.85 在線性迴歸中的正確解釋是什麼?

點選你的答案。

01 總結

一句話總結

R² = 0.85 的意義是85% 的資料變異(y 值的波動)可以被這個線性迴歸模型解釋。這不是「準確率 85%」,而是「模型解釋了資料中 85% 的波動,剩餘 15% 屬於模型捕捉不到的因素或隨機誤差」。

02 情境

先感受問題:為什麼房價不一樣,模型解釋了多少?

「永昌不動產」的資料分析師小玲建了一個線性迴歸模型,用房屋面積來預測台北市的售價。

她發現:台北市的房價差異很大,有人賣 800 萬,有人賣 3000 萬。這些差異(「變異」)是從哪來的?

  • 面積大小(她的模型有考量)
  • 所在行政區(模型沒加入)
  • 樓層、屋齡、裝潢(模型沒加入)
  • 買方出價時機、運氣(隨機因素)

模型跑完,R² = 0.85。這代表:光靠「面積」這一個特徵,就能解釋台北市房價差異的 85%,剩餘 15% 的差異是面積之外的因素造成的。

03 對照

單純觀察均值的問題

  1. 沒有任何模型時的基準:如果完全忽略面積,只用「所有房子的平均價格」來預測每一間,誤差就是所有資料點和均值的差距,叫做「總變異」(TSS)。
  2. 模型的貢獻無法量化:加入面積特徵之後,模型的預測和實際值更接近,誤差縮小了。但「縮小了多少比例」需要一個指標來表達。
  3. 不同規模的問題無法比較:房價的 MSE 和體重的 MSE 單位不同,無法直接比較哪個模型更好。需要一個 0 到 1 之間的無量綱指標。
  4. 無法判斷模型是否優於最簡單的「猜均值」策略:R² 的設計就是來解決這個問題,以「均值預測」作為基準線,看模型比它好多少。
  5. 誤差指標(MSE/RMSE)難以直覺解讀:RMSE = 150 萬,這個數字代表什麼程度的好壞?很難直覺判斷,但 R² = 0.85 代表「解釋了 85%」,更直覺。
04 解法

R² 怎麼量化模型解釋了多少

小玲的線性迴歸模型算出 R² = 0.85,含義是:

模型用面積預測的殘差(實際值與預測值的差異總和 = RSS)比起直接用均值預測的誤差(TSS),縮小了 85%。

換句話說:面積這個特徵「解釋」了台北市房價波動的 85%,讓預測比「猜平均值」準確了 85%。剩餘 15% 的變異是面積無法解釋的——可能是行政區、樓層、或純粹的市場隨機性。

這不代表模型的預測「準確率 85%」,也不代表「誤差 15%」或「信心水準 85%」,這些說法都是對 R² 的誤解。

這就是選項 B 講的:85% 的變異可被模型解釋

技術版:R² 的公式拆解與正確解讀

中級考試大概率會考程式碼跟公式,所以這部分你還是要學。但如果現在學起來很痛苦,可以先跳過,等讀完其他題目回頭再來。

Step 1 純故事版(不出現公式)

想像台北市 100 間房子的售價。如果你什麼都不知道,最好的猜測就是「所有房子的平均價格」。這個猜法和實際售價的差距,叫「總差距」。

現在你知道每間房子的面積了。你建了一條迴歸線,用面積來預測售價。這條線和實際售價的差距,叫「剩餘差距」。

R² 就是:(總差距 - 剩餘差距) ÷ 總差距。它回答的問題是:「知道面積之後,我的猜測比純猜均值好了多少比例?」R² = 0.85 就是「好了 85%」。

Step 2 中文 ↔ 公式對照
白話說法公式
總變異(用均值猜的總誤差平方和)TSS = Σ(yᵢ - ȳ)²
殘差平方和(模型預測的總誤差)RSS = Σ(yᵢ - ŷᵢ)²
決定係數(模型解釋的比例)R² = 1 - RSS/TSS
R² 的另一種理解R² = (TSS - RSS) / TSS
Step 3 符號角色表
yᵢ
第 i 間房子的實際售價
ȳ(y-bar)
所有房子的平均售價
ŷᵢ(y-hat)
模型對第 i 間房子的預測售價
TSS(Total Sum of Squares)
總變異:所有實際值和均值的差距平方和,代表「不用模型時的基準誤差」
RSS(Residual Sum of Squares)
殘差平方和:所有實際值和模型預測值的差距平方和
決定係數:1 減去「殘差/總變異」,表示模型解釋了多少比例的變異
Step 4 完整計算範例
小玲的房價資料(簡化版,5 間房子):
實際售價 y:  1000, 1500, 2000, 2500, 3000(萬元)
均值 ȳ = (1000+1500+2000+2500+3000)/5 = 2000

模型預測 ŷ: 1100, 1600, 1900, 2400, 2800(萬元)

TSS = (1000-2000)² + (1500-2000)² + (2000-2000)² + (2500-2000)² + (3000-2000)²
    = 1000000 + 250000 + 0 + 250000 + 1000000
    = 2500000

RSS = (1000-1100)² + (1500-1600)² + (2000-1900)² + (2500-2400)² + (3000-2800)²
    = 10000 + 10000 + 10000 + 10000 + 40000
    = 80000

R² = 1 - RSS/TSS = 1 - 80000/2500000 = 1 - 0.032 = 0.968

→ 解釋:面積解釋了 96.8% 的房價變異,模型效果非常好
Step 5 自我複述
  1. R² = 0 代表什麼?模型和「猜均值」有什麼差別?
  2. R² = 1 代表什麼?是不是代表模型完美無誤?
  3. 加入更多特徵,R² 一定會升高嗎?(提示:想想過擬合)
  4. R² 能用在分類問題嗎?還是只適合迴歸?
  5. Adjusted R²(調整後 R²)為什麼比 R² 更適合比較不同特徵數的模型?
05 陷阱

為什麼其他選項是錯的

A模型準確率為 85%

字面在說什麼

「準確率 85%」通常用於分類問題,代表模型預測正確的樣本比例。

為什麼不對

R² 是迴歸問題的指標,衡量的是「模型解釋變異的比例」,不是「預測正確的比例」。迴歸的輸出是連續數值,沒有「對或錯」這種二元判斷,只有「預測值和實際值差多遠」。把 R² 解讀成「準確率」混淆了兩種不同任務的評估邏輯。

誰會選錯

從分類問題認識評估指標的人,把「百分之 N = 準確率 N%」的直覺套用到迴歸指標。R² = 0.85 和「分類準確率 85%」雖然數字格式相似,但含義完全不同。

C預測誤差為 15%

字面在說什麼

看到 R² = 0.85,直覺聯想到「85% 好,15% 不好,所以誤差是 15%」。

為什麼不對

1 - R² = 0.15 代表「15% 的變異無法被模型解釋」,不是「預測誤差為 15%」。預測誤差應該用 MSE、RMSE、MAE 等有單位的指標表達(例如:平均誤差 100 萬元),而不是一個無量綱的比例。說「預測誤差 15%」在概念上是混淆了「未解釋變異的比例」和「誤差的量化數值」。

誰會選錯

對「R² 的對稱性」有直覺誤解的人。看到 0.85 就自動算出 1 - 0.85 = 0.15,認為這就是誤差,但兩件事根本不是互補關係。

D模型有 85% 的信心水準

字面在說什麼

信心水準(Confidence Level)是統計假設檢定中的概念,代表我們對某個推論的確信程度(例如 95% 信賴區間)。

為什麼不對

R² 和統計推論的「信心水準」完全是兩個不同的概念,屬於不同的統計框架。信心水準通常是固定值(95%、99%),由研究設計決定,不是由 R² 計算出來的。把 R² = 0.85 解讀成「85% 的信心」是張冠李戴。

誰會選錯

對「R²」和統計學中的「信心水準」同樣陌生,看到 0.85 這個百分比格式的數字,就聯想到「置信度」的人。這兩個概念雖然都用百分比表示,但屬於不同的評估體系。

06 變形

同個考點下次怎麼變形

變形 1

R² = 0 和 R² = 1 各代表什麼?

直覺

R² 的邊界值是 0 和 1,這兩個極端情況下模型的行為是什麼?

答案

R² = 0:模型和「猜均值」一樣差,特徵對預測沒有任何幫助,模型毫無解釋力。R² = 1:模型完美預測所有資料點,殘差為 0,每個預測都和實際值完全吻合(通常代表過擬合或測試資料洩漏)。R² 也可以是負數:當模型比「猜均值」還差時,RSS > TSS,R² 就會小於 0。

變形 2

加入更多特徵,R² 一定會提高嗎?

直覺

加入行政區、樓層等特徵,感覺房價應該能被解釋得更好。

答案

是的,在訓練集上加入更多特徵,R² 只會升高或持平,不會降低——因為數學上,多一個特徵至少不會讓 RSS 增加。但這會導致過擬合,在測試集上的 R² 可能下降。這就是為什麼要用「Adjusted R²(調整後 R²)」,它對特徵數量增加有懲罰項,更適合比較不同特徵數的模型。

變形 3

R² 高就代表模型一定很好嗎?

直覺

R² = 0.95 感覺很高,這個模型應該很可靠吧?

答案

不一定。高 R² 可能是過擬合的信號(尤其在訓練集上)。此外,R² 衡量的是「線性關係的解釋力」,如果資料關係是非線性的,高 R² 的線性模型在外推(預測訓練範圍之外的值)時可能失效。R² 也不告訴你預測誤差的絕對大小——R² = 0.85 的模型,平均誤差可能是 100 萬元,也可能是 1000 萬元,要搭配 RMSE 才能判斷實用性。

變形 4

R² 可以用來評估分類模型嗎?

直覺

R² 既然是「解釋比例」,分類問題的預測結果也有正確和錯誤,能套用嗎?

答案

不適用。R² 的公式基於連續數值的「殘差」和「變異」,在分類問題中沒有對應意義。分類問題用準確率、F1 分數、AUC-ROC 等指標。如果強行在分類問題上計算 R²,結果沒有可解釋的含義。

變形 5

R² 和相關係數(r)是什麼關係?

直覺

R² 寫成「R 平方」,是不是就是相關係數 r 的平方?

答案

對,在簡單線性迴歸(只有一個特徵)中,R² 確實等於皮爾森相關係數 r 的平方:R² = r²。相關係數 r 表示特徵 x 和目標 y 的線性相關強度(-1 到 1),r² 代表 x 能解釋 y 的比例(0 到 1)。多元迴歸(多個特徵)中,R² 不等於任何單一相關係數的平方,但概念相同。

07 延伸

想再往下看,這 5 個

出處

iPAS 經濟部產業人才能力鑑定 ・ 114 年第二梯次 iPAS AI 應用規劃師 中級 科目三 機器學習技術與應用 第 15 題

查看官方原文 PDF