邊界框偵測 是什麼?
Bounding Box — 邊界框偵測 的完整解釋
邊界框偵測是一種電腦視覺技術,用於在影像或影片中定位和識別物體,並使用矩形框標示出物體的位置。
容易混淆
邊界框 vs 圖像分類 分類只回答有沒有,邊界框還要回答物體在哪裡。
邊界框 vs 語義分割 邊界框只畫矩形,分割則要描出更精細的輪廓。
邊界框 vs 追蹤 邊界框是單張影像的定位,追蹤是跨時間維持同一物體的軌跡。
記住這句就好
先看它要解決的是什麼問題,再看它是不是最合適的方法。
實際案例
案例 1:行車影像 系統先框出車、人、腳踏車,才能再做距離或風險判斷。
案例 2:賣場盤點 貨架上哪一格缺貨,可以先靠邊界框標出商品位置。
算法與應用
面向 重點 核心 模型要同時做分類和定位,通常會輸出類別與座標。 評估 常用 IoU、Precision、Recall、mAP 來看效果。 注意 框得準不代表一定適合後續任務,還要看速度和穩定性。
情境判斷
Q1(判斷題): 如果模型只說照片裡有狗,卻沒說狗在哪,算邊界框偵測嗎? → 不算,那只是圖像分類。
Q2(判斷題): 如果兩個物體重疊得很厲害,邊界框就一定夠用嗎? → 不一定,這時可能要更細的分割或更好的後處理。
相關術語
常見問題
邊界框和 mAP 有什麼關係?
mAP 是常用評估指標,用來看不同類別和不同 IoU 門檻下的整體表現。
為什麼會有重複框?
模型可能對同一物體預測出多個候選框,所以要做 NMS。
框越大越好嗎?
不一定,太大會吃掉背景,IoU 也可能變差。