你有沒有在找車子時,先猜大概在哪個位置,再把框慢慢縮準?
你可以把錨框想成目標檢測模型先準備好的候選框,先拿不同大小和長寬比的框去猜,之後再微調成真正物體的位置。它讓模型不用從零開始找每個物體。
這很重要,因為照片裡的物體大小和形狀差很多,先準備好幾種框,模型比較容易抓到。
容易混淆
錨框 vs 邊界框偵測
錨框是先準備好的候選框。
邊界框偵測是最後框出物體的位置。
最關鍵的區別:錨框是起點,邊界框是結果。
錨框 vs 物件偵測
物件偵測是整個任務。
錨框只是其中一個常用設計。
最關鍵的區別:一個是大目標,一個是工具。
錨框 vs 非極大值抑制
錨框負責提出候選。
非極大值抑制負責把重複框刪掉。
最關鍵的區別:一個生框,一個去重。
記住這句就好
先丟很多猜測框,再把最像的那個調準。
實際案例
行人偵測
走路的人可能很細長,也可能只露出半身,錨框提供不同長寬比的起始框,模型才比較容易抓到。
車輛偵測
遠處小車和近處大車大小差很多,如果只用單一框型,模型很容易漏掉其中一種。
算法與應用
常見設計
會先依資料集統計物體大小和比例,再設定多種錨框尺寸,接著用 IoU 來決定哪些錨框對應正樣本。
常見場景
兩階段偵測器和某些單階段偵測器都會用到錨框,只是用法不同。
情境判斷
Q1(直覺題): 一張圖裡同時有小車和大卡車,為什麼需要多種錨框?
→ 因為不同大小的物體需要不同起始框,單一尺寸很容易漏掉其中一種。
Q2(判斷題): 只要錨框設得越多越好嗎?
→ 不一定,這要看情況。錨框太多會讓計算變重,也可能讓正負樣本比例更難調。
常見問題
錨框大小怎麼選?
通常會根據資料集裡物體的大小分布和長寬比來調。
錨框和 IoU 有什麼關係?
IoU 常用來判斷錨框和真實框是不是夠接近,進而分配標籤。
沒有錨框也能做物件偵測嗎?
可以,有些新方法會直接預測物體位置,不靠錨框。
錨框一定比較準嗎?
不一定,它只是常見做法之一,效果還是要看任務和模型設計。