殘差網路(ResNet)是什麼?

ResNet是一種深度學習模型,透過引入殘差連接解決深度神經網路訓練時的梯度消失問題,允許網路學習殘差映射而非直接映射。|本頁含完整原理、應用場景、iPAS 考試重點與 3 個常見問答。

殘差網路(ResNet)是什麼? 深度學習電腦視覺

你看過模型訓練一開始很順,越往後越卡住的情況嗎?

你可以把 ResNet 想成在深層神經網路裡加捷徑,讓模型不用每一步都重新學全部內容。

它重要是因為這個設計讓超深的神經網路真正可訓練,也成為影像模型的經典基礎。

你可以把它想成一個把抽象概念拉回日常判斷的提示,先知道它解決什麼問題,再看技術細節。

容易混淆

ResNet vs 殘差網路

ResNet 是具體模型家族名稱 殘差網路是更通用的架構概念 最關鍵的區別是家族名稱和概念範圍。

ResNet vs DenseNet

ResNet 透過相加保留資訊 DenseNet 透過串接保留資訊 最關鍵的區別是殘差加法和密集串接。

記住這句就好

ResNet 就是把「改一點就好」做成深網路。

實際案例

ImageNet 分類 ResNet-50 這類模型常被拿來當影像分類的強基線,因為它夠深又好訓練。

遷移學習 很多影像專案會直接拿預訓練的 ResNet 當特徵抽取器,再接自己的分類頭。

算法與應用

ResNet 的核心是 residual block,常見版本有 18、34、50、101、152 層。 較深版本常搭配 bottleneck block,先降維再升維,降低計算量。 它之所以經典,是因為把訓練深網路的門檻大幅拉低。

情境判斷

Q1(直覺題): 如果你要拿一個成熟的影像 backbone 來做轉移學習,ResNet 為什麼常被選?

因為它穩定、成熟,而且有很多預訓練權重可直接用。

Q2(判斷題): ResNet 的深度增加後,一定比淺層版本好嗎?

不一定。更深通常更有表現潛力,但也更吃資料和算力,結果要看任務。

常見問題

ResNet 的殘差塊是什麼?

A:就是把輸入直接加回去,讓模型學的是「修正量」而不是從零開始。

ResNet 有哪些常見變體?

A:常見有 ResNet-18、34、50、101、152,差在層數與 block 設計。

ResNet 為什麼影響這麼大?

A:因為它讓深層網路的訓練變得可操作,後來很多架構都沿用殘差思想。