你看過模型訓練一開始很順,越往後越卡住的情況嗎?
你可以把 ResNet 想成在深層神經網路裡加捷徑,讓模型不用每一步都重新學全部內容。
它重要是因為這個設計讓超深的神經網路真正可訓練,也成為影像模型的經典基礎。
你可以把它想成一個把抽象概念拉回日常判斷的提示,先知道它解決什麼問題,再看技術細節。
容易混淆
ResNet vs 殘差網路
ResNet 是具體模型家族名稱 殘差網路是更通用的架構概念 最關鍵的區別是家族名稱和概念範圍。
ResNet vs DenseNet
ResNet 透過相加保留資訊 DenseNet 透過串接保留資訊 最關鍵的區別是殘差加法和密集串接。
記住這句就好
ResNet 就是把「改一點就好」做成深網路。
實際案例
ImageNet 分類 ResNet-50 這類模型常被拿來當影像分類的強基線,因為它夠深又好訓練。
遷移學習 很多影像專案會直接拿預訓練的 ResNet 當特徵抽取器,再接自己的分類頭。
算法與應用
ResNet 的核心是 residual block,常見版本有 18、34、50、101、152 層。 較深版本常搭配 bottleneck block,先降維再升維,降低計算量。 它之所以經典,是因為把訓練深網路的門檻大幅拉低。
情境判斷
Q1(直覺題): 如果你要拿一個成熟的影像 backbone 來做轉移學習,ResNet 為什麼常被選?
Q2(判斷題): ResNet 的深度增加後,一定比淺層版本好嗎?
常見問題
ResNet 的殘差塊是什麼?
A:就是把輸入直接加回去,讓模型學的是「修正量」而不是從零開始。
ResNet 有哪些常見變體?
A:常見有 ResNet-18、34、50、101、152,差在層數與 block 設計。
ResNet 為什麼影響這麼大?
A:因為它讓深層網路的訓練變得可操作,後來很多架構都沿用殘差思想。