邊界框偵測 是什麼?

Bounding Box — 邊界框偵測 的完整解釋

邊界框偵測是一種電腦視覺技術,用於在影像或影片中定位和識別物體,並使用矩形框標示出物體的位置。

容易混淆

邊界框 vs 圖像分類 分類只回答有沒有,邊界框還要回答物體在哪裡。

邊界框 vs 語義分割 邊界框只畫矩形,分割則要描出更精細的輪廓。

邊界框 vs 追蹤 邊界框是單張影像的定位,追蹤是跨時間維持同一物體的軌跡。

記住這句就好

先看它要解決的是什麼問題,再看它是不是最合適的方法。

實際案例

案例 1:行車影像 系統先框出車、人、腳踏車,才能再做距離或風險判斷。

案例 2:賣場盤點 貨架上哪一格缺貨,可以先靠邊界框標出商品位置。

算法與應用

面向 重點
核心 模型要同時做分類和定位,通常會輸出類別與座標。
評估 常用 IoU、Precision、Recall、mAP 來看效果。
注意 框得準不代表一定適合後續任務,還要看速度和穩定性。

情境判斷

Q1(判斷題): 如果模型只說照片裡有狗,卻沒說狗在哪,算邊界框偵測嗎? → 不算,那只是圖像分類。

Q2(判斷題): 如果兩個物體重疊得很厲害,邊界框就一定夠用嗎? → 不一定,這時可能要更細的分割或更好的後處理。

相關術語

常見問題

邊界框和 mAP 有什麼關係?

mAP 是常用評估指標,用來看不同類別和不同 IoU 門檻下的整體表現。

為什麼會有重複框?

模型可能對同一物體預測出多個候選框,所以要做 NMS。

框越大越好嗎?

不一定,太大會吃掉背景,IoU 也可能變差。