線性迴歸法(Linear Regression)是什麼?

線性迴歸法是一種統計方法,用於建立自變數和應變數之間的線性關係模型。目標是找到最佳擬合線,以預測應變數的值。|本頁含完整原理、應用場景、iPAS 考試重點與 3 個常見問答。

線性迴歸法(Linear Regression)是什麼? 機器學習統計方法

你有沒有想過,房價、溫度、銷量這種數字,能不能先用一條線抓出趨勢? 你可以把線性迴歸想成,先畫出一條最貼近資料的直線。 它其實就是用自變數去預測連續數值的模型。 當關係大致像直線時,它常是又快又好懂的起點。

你可以把它想成一個把抽象概念拉回日常判斷的提示,先知道它解決什麼問題,再看技術細節。

容易混淆

線性迴歸 vs 邏輯迴歸 線性迴歸預測連續數值,邏輯迴歸預測分類機率。 一個回答多少,一個回答屬不屬於。

線性迴歸 vs 相關係數 線性迴歸是在做預測,相關係數是在看兩個變數的關聯強弱。 一個有模型,一個偏描述。

最關鍵的區別: 一個拿來預測,一個拿來判斷類別。

記住這句就好

連續數字找直線,分類問題找別的模型。

實際案例

房價預測 把坪數、屋齡、地段當特徵,模型就能估出一個接近市場價格的連續數值。

需求預估 根據溫度、節日、促銷檔期估明天賣多少,線性迴歸常是很直觀的基線。

算法與應用

核心形式通常是 y = wx + b,目標是找到一條誤差最小的線。 常見損失是均方誤差,訓練時會搭配梯度下降或最小平方法。 如果資料關係很彎曲,就可能要考慮多項式迴歸或其他模型。

情境判斷

Q1(直覺題): 你要預測房價,輸出應該是連續數字還是類別?

連續數字,這正是線性迴歸最常處理的輸出型態。

Q2(判斷題): 只要特徵很多,就一定適合線性迴歸嗎?

不一定,還要看關係是不是近似線性,特徵共線性也會影響結果。

常見問題

線性迴歸有什麼基本假設?

常見假設包括線性關係、誤差獨立、變異數固定,實務上還要注意異常值和共線性。

線性迴歸怎麼評估好不好?

常看 MSE、RMSE、MAE 和 R 平方,重點是模型在驗證集上的表現。

線性迴歸一定要先標準化嗎?

不一定,但特徵尺度差很多時,標準化通常能讓訓練更穩。