你有沒有看過一張照片裡有好幾個物件,模型卻要找很久才標得出來?
你可以把 Faster R-CNN 想成先找可疑位置,再做精準確認的偵測流程,先縮小範圍,再判斷那裡是不是目標。
它重要,是因為物件偵測不只要知道「有沒有」,還要知道「在哪裡」,而這一步常比單純分類更費算力。
容易混淆
Faster R-CNN vs R-CNN R-CNN 先找區域、再逐個丟給分類器,流程比較慢。 Faster R-CNN 把區域建議做得更自動,速度和整合度都更好。
錨框 vs 邊界框偵測 錨框是先放好的候選參考框。 邊界框偵測是最後真正輸出的物件位置,兩者不是同一件事。
記住這句就好
先找可能的位置,再判斷是不是目標,就是 Faster R-CNN。
實際案例
路口監視器 先從畫面裡找出可能有車、人、機車的位置,再做分類和框選,速度比逐格人工看快很多。
工廠品管 產線照片裡若要抓瑕疵位置,先用候選區域縮小檢查範圍,再做精細判讀會更有效率。
算法與應用
它的核心是區域建議網路 RPN,會先提出可能含有物件的區域。 接著共享卷積特徵,對候選區域做分類與邊界框回歸,形成兩階段偵測流程。
情境判斷
Q1: 如果你要做圖片裡的人臉偵測,Faster R-CNN 會比只做分類更合適嗎?
Q2: 如果你要在超低延遲手機端即時偵測,Faster R-CNN 一定是最佳選擇嗎?
常見問題
Faster R-CNN 為什麼比舊版快?
因為它把區域建議自動化,減少很多手工搜尋候選區域的成本。
RPN 在做什麼?
它負責提出可能有物件的區域,讓後面的分類與框選更集中。
Faster R-CNN 適合什麼場景?
適合需要較高準確率、可接受多一點計算量的物件偵測工作。
錨框一定要很多嗎?
不一定,數量和尺寸要配合資料集中的物件大小與比例,太多會拖慢計算。