循環神經網路(Recurrent Neural Network)是什麼?

循環神經網路是一種具備「記憶」功能的神經網路,其能處理序列資料,並將前一步的輸出回饋至下一步|本頁含完整原理、應用場景、iPAS 考試重點與 3 個常見問答。

循環神經網路(Recurrent Neural Network)是什麼? iPAS 深度學習神經網路

你在看一句話或一段時間序列時,會不會發現前面出現過的內容會影響後面的判斷?

你可以把 RNN 想成有記憶的神經網路,前一步的資訊會影響下一步。 它特別適合處理有順序的資料,例如文字、語音和時間序列。

你可以把它想成一個把抽象概念拉回日常判斷的提示,先知道它解決什麼問題,再看技術細節。

容易混淆

RNN vs 前饋神經網路 前饋神經網路每次只看當下輸入。 RNN 會把前一步的狀態帶到下一步。 最關鍵的區別:一個看單點,一個看順序。

RNN vs LSTM RNN 結構比較簡單。 LSTM 加了閘門,能更好保存長期資訊。 最關鍵的區別:一個簡單,一個更會記。

RNN vs 注意力機制 RNN 主要靠序列逐步傳遞資訊。 注意力機制會直接看哪些位置比較重要。 最關鍵的區別:一個一路傳,一個直接挑重點。

記住這句就好

看到前面,才能更懂後面。

實際案例

語句理解 你讀到「今天下雨,所以我帶了傘」,後半句會受前半句影響。 RNN 的設計就是為了讓模型保留這種上下文。

時間序列 股票價格、感測器數據和用電量都有前後關係。 RNN 可以把前一個時間點的資訊帶進下一個時間點。

算法與應用

RNN 會把前一時刻的隱藏狀態傳到下一時刻,形成循環結構。 這種設計讓它能處理序列,但也容易遇到梯度消失或梯度爆炸。 為了改善這些問題,後來常用 LSTM、GRU 或注意力機制來取代。

情境判斷

Q1(直覺題): 你要讓模型讀一整句話,知道前文會影響後文,該考慮什麼?

→ RNN,因為它天生就是為了處理順序資料。

Q2(判斷題): 如果序列很長,RNN 一定是最好的選擇嗎?

→ 不一定,長序列常會讓梯度傳遞變難,這時 LSTM、GRU 或注意力機制可能更合適。

iPAS 考題

Q1: LSTM 和 GRU 的主要差別是什麼? → LSTM 門更多、記憶控制更細,GRU 結構較簡化、訓練通常更快。

Q2: 如何緩解 RNN 的梯度消失問題? → 可以用 LSTM、GRU、梯度裁剪,或改用其他更穩定的序列模型。

常見問題

RNN 只適合文字嗎?

不只,任何有順序的資料都可能用到,例如語音、感測器和時間序列。

RNN 一定比前饋網路好嗎?

不一定,要看資料有沒有順序關係,沒有順序就不需要循環結構。

為什麼現在比較少直接用純 RNN?

因為長序列訓練不穩,實務上常改用 LSTM、GRU 或注意力機制。

範例考題

某公車系統想預測各站點的到站時間,需要考慮歷史班次資料、即時路況、天氣等因素。由於路況變化複雜,傳統循環神經網路(Recurrent Neural Network, RNN)在建模時可能難以保留較早期的重要資訊。下列哪種架構最能解決這個問題?

  • A. 卷積神經網路(Convolutional Neural Network, CNN),利用卷積層捕捉局部特徵
  • B. 自編碼器(Autoencoder, AE),先進行資料壓縮再重建
  • C. 全連接神經網路(Fully Connected Neural Network, FCNN),增加隱藏層數量
  • D. 長短期記憶網路(Long Short-Term Memory, LSTM),改善 RNN 的長期記憶問題 ✓ 正確答案

解析:

LSTM 是專門設計來解決 RNN 長期依賴問題的架構,透過門控機制(遺忘門、輸入門、輸出門)控制資訊的保留和遺忘,能有效保留較早期的重要資訊,適合此時序預測任務。

立即測驗

想測試你對 循環神經網路 的掌握程度? 開始模擬考