---
title: "循環神經網路（Recurrent Neural Network）"
slug: recurrent-neural-network
language: zh-TW
source: https://aiterms.tw/terms/recurrent-neural-network
updated_at: 2026-04-29
tags: [深度學習, 神經網路, 自然語言處理, 時序分析]
ipas_term: true
---

# 循環神經網路（Recurrent Neural Network）

> **你在看一句話或一段時間序列時，會不會發現前面出現過的內容會影響後面的判斷？**
>
> 你可以把 RNN 想成有記憶的神經網路，前一步的資訊會影響下一步。
> 它特別適合處理有順序的資料，例如文字、語音和時間序列。
>
> 你可以把它想成一個把抽象概念拉回日常判斷的提示，先知道它解決什麼問題，再看技術細節。

### 容易混淆
> **RNN vs 前饋神經網路**
> 前饋神經網路每次只看當下輸入。
> RNN 會把前一步的狀態帶到下一步。
> 最關鍵的區別：一個看單點，一個看順序。
>
> **RNN vs LSTM**
> RNN 結構比較簡單。
> LSTM 加了閘門，能更好保存長期資訊。
> 最關鍵的區別：一個簡單，一個更會記。
>
> **RNN vs 注意力機制**
> RNN 主要靠序列逐步傳遞資訊。
> 注意力機制會直接看哪些位置比較重要。
> 最關鍵的區別：一個一路傳，一個直接挑重點。

### 記住這句就好
> 看到前面，才能更懂後面。

### 實際案例
> **語句理解**
> 你讀到「今天下雨，所以我帶了傘」，後半句會受前半句影響。
> RNN 的設計就是為了讓模型保留這種上下文。
>
> **時間序列**
> 股票價格、感測器數據和用電量都有前後關係。
> RNN 可以把前一個時間點的資訊帶進下一個時間點。

### 算法與應用
> RNN 會把前一時刻的隱藏狀態傳到下一時刻，形成循環結構。
> 這種設計讓它能處理序列，但也容易遇到梯度消失或梯度爆炸。
> 為了改善這些問題，後來常用 LSTM、GRU 或注意力機制來取代。

### 情境判斷
> **Q1（直覺題）：** 你要讓模型讀一整句話，知道前文會影響後文，該考慮什麼？
>
> → RNN，因為它天生就是為了處理順序資料。
>
> **Q2（判斷題）：** 如果序列很長，RNN 一定是最好的選擇嗎？
>
> → 不一定，長序列常會讓梯度傳遞變難，這時 LSTM、GRU 或注意力機制可能更合適。

### iPAS 考題
> **Q1：** LSTM 和 GRU 的主要差別是什麼？
> → LSTM 門更多、記憶控制更細，GRU 結構較簡化、訓練通常更快。
>
> **Q2：** 如何緩解 RNN 的梯度消失問題？
> → 可以用 LSTM、GRU、梯度裁剪，或改用其他更穩定的序列模型。

### 常見問題
> **Q：RNN 只適合文字嗎？**
> 不只，任何有順序的資料都可能用到，例如語音、感測器和時間序列。
>
> **Q：RNN 一定比前饋網路好嗎？**
> 不一定，要看資料有沒有順序關係，沒有順序就不需要循環結構。
>
> **Q：為什麼現在比較少直接用純 RNN？**
> 因為長序列訓練不穩，實務上常改用 LSTM、GRU 或注意力機制。

### 相關術語
> - **長短期記憶網路**：先看它，你會知道 RNN 怎麼補強長期記憶。
> - **注意力機制**：如果你想看更現代的序列建模，這是下一步。
> - **編碼器**：很多序列模型都會和它一起出現。
> - **自然語言處理**：RNN 曾經是 NLP 的核心模型。
> - **深度學習**：RNN 是經典的深度學習架構之一。

---

來源：https://aiterms.tw/terms/recurrent-neural-network
快查頁：https://aiterms.tw/terms/recurrent-neural-network
最後更新：2026/04/29
深度解說：https://aiterms.tw/learning/what-is-recurrent-neural-network