iPAS AI 應用規劃師中級　科目三　機器學習技術與應用

線性迴歸的 R² 值 0.85 代表什麼意義？

原題 15

在線性迴歸模型中，若 R² 值為 0.85，其意義為何？

白話

線性迴歸模型訓練完之後，我們會用一些指標來評估它到底做得好不好。R²（R 平方，也叫決定係數）就是其中一個評估指標，是一個介於 0 和 1 之間的數值。

題目給了一個具體的例子：R² = 0.85，問你這個數字代表什麼意思。

問你：R² = 0.85 在線性迴歸中的正確解釋是什麼？

點選你的答案。

← 回 50 題列表回 iPAS 備考總覽

01　總結

一句話總結

R² = 0.85 的意義是85% 的資料變異（y 值的波動）可以被這個線性迴歸模型解釋。這不是「準確率 85%」，而是「模型解釋了資料中 85% 的波動，剩餘 15% 屬於模型捕捉不到的因素或隨機誤差」。

02　情境

先感受問題：為什麼房價不一樣，模型解釋了多少？

「永昌不動產」的資料分析師小玲建了一個線性迴歸模型，用房屋面積來預測台北市的售價。

她發現：台北市的房價差異很大，有人賣 800 萬，有人賣 3000 萬。這些差異（「變異」）是從哪來的？

面積大小（她的模型有考量）
所在行政區（模型沒加入）
樓層、屋齡、裝潢（模型沒加入）
買方出價時機、運氣（隨機因素）

模型跑完，R² = 0.85。這代表：光靠「面積」這一個特徵，就能解釋台北市房價差異的 85%，剩餘 15% 的差異是面積之外的因素造成的。

03　對照

單純觀察均值的問題

沒有任何模型時的基準：如果完全忽略面積，只用「所有房子的平均價格」來預測每一間，誤差就是所有資料點和均值的差距，叫做「總變異」（TSS）。
模型的貢獻無法量化：加入面積特徵之後，模型的預測和實際值更接近，誤差縮小了。但「縮小了多少比例」需要一個指標來表達。
不同規模的問題無法比較：房價的 MSE 和體重的 MSE 單位不同，無法直接比較哪個模型更好。需要一個 0 到 1 之間的無量綱指標。
無法判斷模型是否優於最簡單的「猜均值」策略：R² 的設計就是來解決這個問題，以「均值預測」作為基準線，看模型比它好多少。
誤差指標（MSE/RMSE）難以直覺解讀：RMSE = 150 萬，這個數字代表什麼程度的好壞？很難直覺判斷，但 R² = 0.85 代表「解釋了 85%」，更直覺。

04　解法

R² 怎麼量化模型解釋了多少

小玲的線性迴歸模型算出 R² = 0.85，含義是：

模型用面積預測的殘差（實際值與預測值的差異總和 = RSS）比起直接用均值預測的誤差（TSS），縮小了 85%。

換句話說：面積這個特徵「解釋」了台北市房價波動的 85%，讓預測比「猜平均值」準確了 85%。剩餘 15% 的變異是面積無法解釋的——可能是行政區、樓層、或純粹的市場隨機性。

這不代表模型的預測「準確率 85%」，也不代表「誤差 15%」或「信心水準 85%」，這些說法都是對 R² 的誤解。

這就是選項 B 講的：85% 的變異可被模型解釋。

技術版：R² 的公式拆解與正確解讀

中級考試大概率會考程式碼跟公式，所以這部分你還是要學。但如果現在學起來很痛苦，可以先跳過，等讀完其他題目回頭再來。

Step 1 純故事版（不出現公式）

想像台北市 100 間房子的售價。如果你什麼都不知道，最好的猜測就是「所有房子的平均價格」。這個猜法和實際售價的差距，叫「總差距」。

現在你知道每間房子的面積了。你建了一條迴歸線，用面積來預測售價。這條線和實際售價的差距，叫「剩餘差距」。

R² 就是：(總差距 - 剩餘差距) ÷ 總差距。它回答的問題是：「知道面積之後，我的猜測比純猜均值好了多少比例？」R² = 0.85 就是「好了 85%」。

Step 2 中文 ↔ 公式對照

白話說法	公式
總變異（用均值猜的總誤差平方和）	TSS = Σ(yᵢ - ȳ)²
殘差平方和（模型預測的總誤差）	RSS = Σ(yᵢ - ŷᵢ)²
決定係數（模型解釋的比例）	R² = 1 - RSS/TSS
R² 的另一種理解	R² = (TSS - RSS) / TSS

Step 3 符號角色表

yᵢ: 第 i 間房子的實際售價
ȳ（y-bar）: 所有房子的平均售價
ŷᵢ（y-hat）: 模型對第 i 間房子的預測售價
TSS（Total Sum of Squares）: 總變異：所有實際值和均值的差距平方和，代表「不用模型時的基準誤差」
RSS（Residual Sum of Squares）: 殘差平方和：所有實際值和模型預測值的差距平方和
R²: 決定係數：1 減去「殘差/總變異」，表示模型解釋了多少比例的變異

Step 4 完整計算範例

小玲的房價資料（簡化版，5 間房子）：
實際售價 y:  1000, 1500, 2000, 2500, 3000（萬元）
均值 ȳ = (1000+1500+2000+2500+3000)/5 = 2000

模型預測 ŷ: 1100, 1600, 1900, 2400, 2800（萬元）

TSS = (1000-2000)² + (1500-2000)² + (2000-2000)² + (2500-2000)² + (3000-2000)²
    = 1000000 + 250000 + 0 + 250000 + 1000000
    = 2500000

RSS = (1000-1100)² + (1500-1600)² + (2000-1900)² + (2500-2400)² + (3000-2800)²
    = 10000 + 10000 + 10000 + 10000 + 40000
    = 80000

R² = 1 - RSS/TSS = 1 - 80000/2500000 = 1 - 0.032 = 0.968

→ 解釋：面積解釋了 96.8% 的房價變異，模型效果非常好

Step 5 自我複述

R² = 0 代表什麼？模型和「猜均值」有什麼差別？
R² = 1 代表什麼？是不是代表模型完美無誤？
加入更多特徵，R² 一定會升高嗎？（提示：想想過擬合）
R² 能用在分類問題嗎？還是只適合迴歸？
Adjusted R²（調整後 R²）為什麼比 R² 更適合比較不同特徵數的模型？

05　陷阱

為什麼其他選項是錯的

A模型準確率為 85%

字面在說什麼

「準確率 85%」通常用於分類問題，代表模型預測正確的樣本比例。

為什麼不對

R² 是迴歸問題的指標，衡量的是「模型解釋變異的比例」，不是「預測正確的比例」。迴歸的輸出是連續數值，沒有「對或錯」這種二元判斷，只有「預測值和實際值差多遠」。把 R² 解讀成「準確率」混淆了兩種不同任務的評估邏輯。

誰會選錯

從分類問題認識評估指標的人，把「百分之 N = 準確率 N%」的直覺套用到迴歸指標。R² = 0.85 和「分類準確率 85%」雖然數字格式相似，但含義完全不同。

C預測誤差為 15%

字面在說什麼

看到 R² = 0.85，直覺聯想到「85% 好，15% 不好，所以誤差是 15%」。

為什麼不對

1 - R² = 0.15 代表「15% 的變異無法被模型解釋」，不是「預測誤差為 15%」。預測誤差應該用 MSE、RMSE、MAE 等有單位的指標表達（例如：平均誤差 100 萬元），而不是一個無量綱的比例。說「預測誤差 15%」在概念上是混淆了「未解釋變異的比例」和「誤差的量化數值」。

誰會選錯

對「R² 的對稱性」有直覺誤解的人。看到 0.85 就自動算出 1 - 0.85 = 0.15，認為這就是誤差，但兩件事根本不是互補關係。

D模型有 85% 的信心水準

字面在說什麼

信心水準（Confidence Level）是統計假設檢定中的概念，代表我們對某個推論的確信程度（例如 95% 信賴區間）。

為什麼不對

R² 和統計推論的「信心水準」完全是兩個不同的概念，屬於不同的統計框架。信心水準通常是固定值（95%、99%），由研究設計決定，不是由 R² 計算出來的。把 R² = 0.85 解讀成「85% 的信心」是張冠李戴。

誰會選錯

對「R²」和統計學中的「信心水準」同樣陌生，看到 0.85 這個百分比格式的數字，就聯想到「置信度」的人。這兩個概念雖然都用百分比表示，但屬於不同的評估體系。

06　變形

同個考點下次怎麼變形

變形 1

R² = 0 和 R² = 1 各代表什麼？

直覺

R² 的邊界值是 0 和 1，這兩個極端情況下模型的行為是什麼？

答案

R² = 0：模型和「猜均值」一樣差，特徵對預測沒有任何幫助，模型毫無解釋力。R² = 1：模型完美預測所有資料點，殘差為 0，每個預測都和實際值完全吻合（通常代表過擬合或測試資料洩漏）。R² 也可以是負數：當模型比「猜均值」還差時，RSS > TSS，R² 就會小於 0。

變形 2

加入更多特徵，R² 一定會提高嗎？

直覺

加入行政區、樓層等特徵，感覺房價應該能被解釋得更好。

答案

是的，在訓練集上加入更多特徵，R² 只會升高或持平，不會降低——因為數學上，多一個特徵至少不會讓 RSS 增加。但這會導致過擬合，在測試集上的 R² 可能下降。這就是為什麼要用「Adjusted R²（調整後 R²）」，它對特徵數量增加有懲罰項，更適合比較不同特徵數的模型。

變形 3

R² 高就代表模型一定很好嗎？

直覺

R² = 0.95 感覺很高，這個模型應該很可靠吧？

答案

不一定。高 R² 可能是過擬合的信號（尤其在訓練集上）。此外，R² 衡量的是「線性關係的解釋力」，如果資料關係是非線性的，高 R² 的線性模型在外推（預測訓練範圍之外的值）時可能失效。R² 也不告訴你預測誤差的絕對大小——R² = 0.85 的模型，平均誤差可能是 100 萬元，也可能是 1000 萬元，要搭配 RMSE 才能判斷實用性。

變形 4

R² 可以用來評估分類模型嗎？

直覺

R² 既然是「解釋比例」，分類問題的預測結果也有正確和錯誤，能套用嗎？

答案

不適用。R² 的公式基於連續數值的「殘差」和「變異」，在分類問題中沒有對應意義。分類問題用準確率、F1 分數、AUC-ROC 等指標。如果強行在分類問題上計算 R²，結果沒有可解釋的含義。

變形 5

R² 和相關係數（r）是什麼關係？

直覺

R² 寫成「R 平方」，是不是就是相關係數 r 的平方？

答案

對，在簡單線性迴歸（只有一個特徵）中，R² 確實等於皮爾森相關係數 r 的平方：R² = r²。相關係數 r 表示特徵 x 和目標 y 的線性相關強度（-1 到 1），r² 代表 x 能解釋 y 的比例（0 到 1）。多元迴歸（多個特徵）中，R² 不等於任何單一相關係數的平方，但概念相同。

07　延伸

想再往下看，這 5 個

判定係數（R-squared）本題核心，衡量線性迴歸模型解釋依變數變異比例的指標，範圍 0 到 1，越高代表模型解釋力越強。
線性迴歸（Linear Regression）R² 的原生使用場景，用來建立自變數和依變數之間線性關係的模型，R² 是其標準評估指標。
均方誤差（Mean Squared Error）和 R² 搭配使用的迴歸評估指標，提供預測誤差的絕對量化值，補足 R² 無法反映誤差實際大小的不足。
過擬合（Overfitting）R² 在訓練集上虛高的主要原因，新增特徵雖然提升訓練集 R²，但可能讓模型在測試集上表現更差。
偏差方差權衡（Bias-Variance Tradeoff）解釋為什麼高訓練集 R² 不一定代表好的泛化能力，是正確解讀 R² 的理論背景。