iPAS AI 應用規劃師中級　科目一

ARIMA 預測殘差週期性波動，代表什麼問題？

原題 39

某企業的資料科學團隊利用 ARIMA 模型（AutoRegressive Integrated Moving Average Model）預測每週產品銷售量。模型建立完成後，分析人員發現預測誤差隨時間呈現週期性波動，且自相關函數（ACF）顯示殘差在多個時間滯（Lag）上仍顯著不為零。根據上述現象，最合理的模型診斷結論為何？

白話

一家公司用 ARIMA 模型（一種預測時間序列的工具）來預測每週的銷售量。

建完模型後，他們發現兩個現象：(1) 預測誤差（殘差）呈現週期性波動，不是隨機的；(2) ACF（自相關函數）顯示殘差在好幾個時間滯上還是跟前幾個時間點有關聯。

問你：根據這兩個現象，最合理的診斷結論是什麼？

點選你的答案。

← 回 50 題列表回 iPAS 備考總覽

01　總結

一句話總結

殘差有週期性波動、ACF 在多個 Lag 顯著不為零，這兩件事加在一起只有一個結論：模型配適不足（Underfitting），時間序列裡的週期性規律沒有被捕捉到，需要調整 ARIMA 的 p（自回歸階數）或 q（移動平均階數）來補救這些被漏掉的時間依賴性。

02　情境

先感受問題：殘差「不隨機」代表什麼

假設「台灣消費品公司」的資料分析師怡君，用 ARIMA 模型預測每週洗衣精的銷售量。

模型建完後，怡君計算預測殘差（每週實際銷售 - 預測值）：

第 1 週：低估 +500 箱
第 2 週：低估 +450 箱
第 3 週：低估 +200 箱
第 4 週：高估 -100 箱
第 5 週：低估 +480 箱（又開始循環）
...（每 4～5 週一個循環）

如果模型夠好，殘差應該是隨機亂跳（白噪音），沒有規律。但怡君看到的殘差是有週期性的，每幾週就重複一次高低起伏的模式。

這代表：模型沒有把「每週銷售裡本來就有的週期性規律」（例如月底前後銷售波動）給學進去。殘差裡還留著這個被漏掉的資訊。

03　對照

為什麼殘差「理應隨機」，以及 ARIMA 哪裡沒學到

一個良好的時間序列模型，最終殘差應該滿足：

零均值：不系統性地高估或低估。
無自相關性：前一個殘差和後一個殘差沒有關聯（ACF 圖上所有 Lag 都不顯著）。
常態分佈：殘差分佈接近鐘形曲線。
同質變異數：殘差的波動幅度不隨時間改變（異方差性 Heteroscedasticity）。
無週期性模式：殘差的時間序列圖不應有週期性起伏。

怡君的模型違反了第 2 條和第 5 條。ACF 顯示殘差在多個 Lag 顯著，代表「這週的殘差跟前幾週的殘差有相關」，也就是說模型漏掉了某種時間規律。這種漏掉叫做「配適不足」（Underfitting）。

04　解法

ACF 顯著在哪個 Lag，就調哪個參數

ARIMA(p, d, q) 的三個參數各管一件事：

p（AR 階數）：用前幾個時間點的值預測現在
d（差分次數）：做幾次差分讓序列平穩
q（MA 階數）：用前幾個時間點的誤差修正現在的預測

診斷流程：

看 ACF 在哪些 Lag 顯著：如果 Lag 1、2、3 都顯著，代表 MA 項（q 值）不夠，需要增加 q。如果偏自相關函數（PACF）在特定 Lag 顯著，代表 AR 項（p 值）不夠，需要增加 p。如果殘差呈現每 4 週一個週期，可能需要改用季節性 ARIMA（SARIMA），加入季節性參數（P、D、Q、s）。

怡君的行動：發現殘差每 4～5 週週期性波動，ACF 在 Lag 4 和 Lag 8 顯著，這是典型的季節性未被捕捉。解法是從 ARIMA 升級為 SARIMA(p, d, q)(P, D, Q, 4)，讓模型顯式地學習每 4 週的季節性規律。

這就是選項 C 講的：模型存在配適不足（Underfitting）問題，需重新調整 p 或 q 參數以捕捉時間依賴性。

技術版：ARIMA 的 ACF/PACF 診斷與殘差檢定方法

中級考試大概率會考程式碼跟公式，所以這部分你還是要學。但如果現在學起來很痛苦，可以先跳過，等讀完其他題目回頭再來。

本題沒有程式碼，但相關技術背景值得知道。

ARIMA(p, d, q) 完整公式：

先對原序列做 d 次差分，讓序列平穩（Stationary）：

ΔY_t = Y_t - Y_{t-1}         （一次差分，d=1）
Δ²Y_t = ΔY_t - ΔY_{t-1}     （二次差分，d=2）

差分後的序列 w_t 用 ARMA(p, q) 建模：

w_t = φ₁w_{t-1} + φ₂w_{t-2} + ... + φₚw_{t-p}
    + θ₁ε_{t-1} + θ₂ε_{t-2} + ... + θ_qε_{t-q} + ε_t

其中 ε_t 是白噪音（White Noise），φ 是 AR 係數，θ 是 MA 係數。

ACF 和 PACF 的診斷用法：

ACF（自相關函數）：衡量序列和它自己在各個時間滯的相關性。純 MA 過程的 ACF 在 q 個 Lag 後截斷。
PACF（偏自相關函數）：控制中間 Lag 的影響後，當前值和特定 Lag 的直接相關性。純 AR 過程的 PACF 在 p 個 Lag 後截斷。
殘差 ACF 全部不顯著（落在信賴區間內）= 白噪音 = 模型良好。
殘差 ACF 在某些 Lag 顯著 = 這些 Lag 的時間依賴性未被捕捉 = 配適不足。

Ljung-Box 檢定：

正式的殘差白噪音統計檢定。H₀（虛無假設）：殘差是白噪音（沒有自相關）。p 值小於 0.05 則拒絕 H₀，確認殘差有顯著的自相關，模型診斷不良。

SARIMA 季節性擴展：

若週期性殘差是由季節性（每 s 個時間點一個週期）造成，需要 SARIMA(p, d, q)(P, D, Q, s)：s 是季節週期長度，P/D/Q 是季節性 AR、差分、MA 的階數。

05　陷阱

為什麼其他選項是錯的

A模型殘差符合白噪音（White Noise）假設，預測表現穩定

字面在說什麼

認為殘差已經是隨機的，沒有規律，模型預測是穩定的。

為什麼不對

白噪音的定義是「無自相關、均值為零、常數變異數」。題目明確說「ACF 顯示殘差在多個 Lag 顯著不為零」，這直接違反「無自相關」的要求。白噪音假設已被統計上推翻，選 A 是無視數據說謊。

誰會選錯

不知道「ACF 顯著」代表自相關存在的考生，或看到「預測表現穩定」就覺得合理的考生。記住：殘差 ACF 任何一個 Lag 顯著，就代表白噪音假設被破壞了。

B模型殘差雖有輕微異常，但可視為隨機誤差忽略不計

字面在說什麼

殘差確實有點奇怪，但問題不大，可以當成隨機雜訊忽略。

為什麼不對

題目說的是「多個 Lag 上仍顯著」，不是一個小偏差。週期性波動 + 多個 Lag ACF 顯著，這是系統性的問題，不是隨機誤差。隨機誤差沒有規律，但題目描述的殘差有明顯的週期性模式，「輕微異常」的描述與題目事實不符。

誰會選錯

害怕下「模型有問題」的結論、傾向「合理化現有結果」的考生。統計診斷不能「差不多就好」，ACF 顯著就是顯著，需要正視並修正。

D殘差特性不影響預測結果，無須進一步修正

字面在說什麼

就算殘差有問題，對最終預測數字影響不大，不需要改模型。

為什麼不對

殘差有自相關，代表模型「還沒把所有可預測的資訊都用完」，也就是說改進空間存在。如果不修正，預測的信賴區間會失真（被低估），導致風險評估不準確。更重要的是，殘差週期性波動代表模型系統性地在某些時間點高估、某些時間點低估，這直接影響預測準確性。

差分整合移動平均（ARIMA）時間序列預測的經典統計模型，殘差出現週期性 ACF 顯著意味著模型遺漏了季節結構，應升級為 SARIMA。
時間序列分析（Time Series Analysis）分析隨時間演變的資料序列的統計方法，包含平穩性檢定、自相關診斷、季節性分解等步驟，是本題的整體分析框架。
季節性分解（Seasonal Decomposition）將時間序列拆解為趨勢、季節、殘差三個成分；ARIMA 殘差的週期性波動代表季節成分未被模型充分捕捉。
先知預測模型（Prophet）Facebook 開源的時間序列預測工具，內建季節性和節假日效應處理，是 ARIMA/SARIMA 之外另一個常用的替代方案。
異常偵測（Anomaly Detection）偵測時間序列中不符合預期規律的點或區間，與殘差分析互補；殘差不為白噪音時可進一步用異常偵測定位問題期間。