循環神經網路 是什麼?
Recurrent Neural Network — 循環神經網路 的完整解釋
循環神經網路是一種具備「記憶」功能的神經網路,其能處理序列資料,並將前一步的輸出回饋至下一步
容易混淆
RNN vs 前饋神經網路 前饋神經網路每次只看當下輸入。 RNN 會把前一步的狀態帶到下一步。 最關鍵的區別:一個看單點,一個看順序。
RNN vs LSTM RNN 結構比較簡單。 LSTM 加了閘門,能更好保存長期資訊。 最關鍵的區別:一個簡單,一個更會記。
RNN vs 注意力機制 RNN 主要靠序列逐步傳遞資訊。 注意力機制會直接看哪些位置比較重要。 最關鍵的區別:一個一路傳,一個直接挑重點。
記住這句就好
看到前面,才能更懂後面。
實際案例
語句理解 你讀到「今天下雨,所以我帶了傘」,後半句會受前半句影響。 RNN 的設計就是為了讓模型保留這種上下文。
時間序列 股票價格、感測器數據和用電量都有前後關係。 RNN 可以把前一個時間點的資訊帶進下一個時間點。
算法與應用
RNN 會把前一時刻的隱藏狀態傳到下一時刻,形成循環結構。 這種設計讓它能處理序列,但也容易遇到梯度消失或梯度爆炸。 為了改善這些問題,後來常用 LSTM、GRU 或注意力機制來取代。
情境判斷
Q1(直覺題): 你要讓模型讀一整句話,知道前文會影響後文,該考慮什麼?
→ RNN,因為它天生就是為了處理順序資料。
Q2(判斷題): 如果序列很長,RNN 一定是最好的選擇嗎?
→ 不一定,長序列常會讓梯度傳遞變難,這時 LSTM、GRU 或注意力機制可能更合適。
循環神經網路 在 iPAS 考試中的重點
根據歷年統計,循環神經網路 相關題目 平均佔 AI 技術類考題 3%, 屬於未分類考範圍。
常見出題方向:循環神經網路的演算法原理與架構(40%)、序列資料處理的數學模型(35%)、RNN 的應用與限制分析(25%)。
相關術語
常見問題
RNN 只適合文字嗎?
不只,任何有順序的資料都可能用到,例如語音、感測器和時間序列。
RNN 一定比前饋網路好嗎?
不一定,要看資料有沒有順序關係,沒有順序就不需要循環結構。
為什麼現在比較少直接用純 RNN?
因為長序列訓練不穩,實務上常改用 LSTM、GRU 或注意力機制。
資料來源
- iPAS AI 應用規劃師評鑑內容範圍參考(115.02) — 經濟部產業人才能力鑑定