循環神經網路 是什麼?

Recurrent Neural Network — 循環神經網路 的完整解釋

循環神經網路是一種具備「記憶」功能的神經網路,其能處理序列資料,並將前一步的輸出回饋至下一步

容易混淆

RNN vs 前饋神經網路 前饋神經網路每次只看當下輸入。 RNN 會把前一步的狀態帶到下一步。 最關鍵的區別:一個看單點,一個看順序。

RNN vs LSTM RNN 結構比較簡單。 LSTM 加了閘門,能更好保存長期資訊。 最關鍵的區別:一個簡單,一個更會記。

RNN vs 注意力機制 RNN 主要靠序列逐步傳遞資訊。 注意力機制會直接看哪些位置比較重要。 最關鍵的區別:一個一路傳,一個直接挑重點。

記住這句就好

看到前面,才能更懂後面。

實際案例

語句理解 你讀到「今天下雨,所以我帶了傘」,後半句會受前半句影響。 RNN 的設計就是為了讓模型保留這種上下文。

時間序列 股票價格、感測器數據和用電量都有前後關係。 RNN 可以把前一個時間點的資訊帶進下一個時間點。

算法與應用

RNN 會把前一時刻的隱藏狀態傳到下一時刻,形成循環結構。 這種設計讓它能處理序列,但也容易遇到梯度消失或梯度爆炸。 為了改善這些問題,後來常用 LSTM、GRU 或注意力機制來取代。

情境判斷

Q1(直覺題): 你要讓模型讀一整句話,知道前文會影響後文,該考慮什麼?

→ RNN,因為它天生就是為了處理順序資料。

Q2(判斷題): 如果序列很長,RNN 一定是最好的選擇嗎?

→ 不一定,長序列常會讓梯度傳遞變難,這時 LSTM、GRU 或注意力機制可能更合適。

循環神經網路 在 iPAS 考試中的重點

根據歷年統計,循環神經網路 相關題目 平均佔 AI 技術類考題 3%, 屬於未分類考範圍。

常見出題方向:循環神經網路的演算法原理與架構(40%)、序列資料處理的數學模型(35%)、RNN 的應用與限制分析(25%)。

相關術語

常見問題

RNN 只適合文字嗎?

不只,任何有順序的資料都可能用到,例如語音、感測器和時間序列。

RNN 一定比前饋網路好嗎?

不一定,要看資料有沒有順序關係,沒有順序就不需要循環結構。

為什麼現在比較少直接用純 RNN?

因為長序列訓練不穩,實務上常改用 LSTM、GRU 或注意力機制。

資料來源

← 回到 循環神經網路 快查頁

測驗你對 循環神經網路 的理解

透過模擬考系統檢驗學習成果

開始測驗