RNN（循環神經網路）是什麼？完整定義與解說

iPAS 深度學習神經網路

你在看一句話或一段時間序列時，會不會發現前面出現過的內容會影響後面的判斷？

你可以把 RNN 想成有記憶的神經網路，前一步的資訊會影響下一步。它特別適合處理有順序的資料，例如文字、語音和時間序列。

你可以把它想成一個把抽象概念拉回日常判斷的提示，先知道它解決什麼問題，再看技術細節。

容易混淆

RNN vs 前饋神經網路 前饋神經網路每次只看當下輸入。 RNN 會把前一步的狀態帶到下一步。最關鍵的區別：一個看單點，一個看順序。

RNN vs LSTM RNN 結構比較簡單。 LSTM 加了閘門，能更好保存長期資訊。最關鍵的區別：一個簡單，一個更會記。

RNN vs 注意力機制 RNN 主要靠序列逐步傳遞資訊。注意力機制會直接看哪些位置比較重要。最關鍵的區別：一個一路傳，一個直接挑重點。

記住這句就好

看到前面，才能更懂後面。

實際案例

語句理解 你讀到「今天下雨，所以我帶了傘」，後半句會受前半句影響。 RNN 的設計就是為了讓模型保留這種上下文。

時間序列 股票價格、感測器數據和用電量都有前後關係。 RNN 可以把前一個時間點的資訊帶進下一個時間點。

算法與應用

RNN 會把前一時刻的隱藏狀態傳到下一時刻，形成循環結構。這種設計讓它能處理序列，但也容易遇到梯度消失或梯度爆炸。為了改善這些問題，後來常用 LSTM、GRU 或注意力機制來取代。

情境判斷

Q1（直覺題）： 你要讓模型讀一整句話，知道前文會影響後文，該考慮什麼？

→ RNN，因為它天生就是為了處理順序資料。

Q2（判斷題）： 如果序列很長，RNN 一定是最好的選擇嗎？

→ 不一定，長序列常會讓梯度傳遞變難，這時 LSTM、GRU 或注意力機制可能更合適。

iPAS 考題

Q1： LSTM 和 GRU 的主要差別是什麼？ → LSTM 門更多、記憶控制更細，GRU 結構較簡化、訓練通常更快。

Q2： 如何緩解 RNN 的梯度消失問題？ → 可以用 LSTM、GRU、梯度裁剪，或改用其他更穩定的序列模型。

常見問題

RNN 只適合文字嗎？

不只，任何有順序的資料都可能用到，例如語音、感測器和時間序列。

RNN 一定比前饋網路好嗎？

不一定，要看資料有沒有順序關係，沒有順序就不需要循環結構。

為什麼現在比較少直接用純 RNN？

因為長序列訓練不穩，實務上常改用 LSTM、GRU 或注意力機制。

範例考題

某公車系統想預測各站點的到站時間，需要考慮歷史班次資料、即時路況、天氣等因素。由於路況變化複雜，傳統循環神經網路（Recurrent Neural Network, RNN）在建模時可能難以保留較早期的重要資訊。下列哪種架構最能解決這個問題？

A. 卷積神經網路（Convolutional Neural Network, CNN），利用卷積層捕捉局部特徵
B. 自編碼器（Autoencoder, AE），先進行資料壓縮再重建
C. 全連接神經網路（Fully Connected Neural Network, FCNN），增加隱藏層數量
D. 長短期記憶網路（Long Short-Term Memory, LSTM），改善 RNN 的長期記憶問題 ✓ 正確答案

解析：

LSTM 是專門設計來解決 RNN 長期依賴問題的架構，透過門控機制（遺忘門、輸入門、輸出門）控制資訊的保留和遺忘，能有效保留較早期的重要資訊，適合此時序預測任務。

循環神經網路（Recurrent Neural Network）是什麼？

容易混淆

記住這句就好

實際案例

算法與應用

情境判斷

iPAS 考題

常見問題

範例考題

立即測驗

容易混淆

記住這句就好

實際案例

算法與應用

情境判斷

iPAS 考題

常見問題

相關術語

範例考題

延伸學習

立即測驗

資料來源與參考依據