物件偵測 是什麼?

Object Detection — 物件偵測 的完整解釋

物件偵測是一種電腦視覺技術,用於識別影像或影片中特定物件的位置和類別,常用於自動駕駛、安全監控、零售分析等。

容易混淆

物件偵測 vs 影像分類 物件偵測:找出物件位置和類別 影像分類:只判斷整張圖屬於哪一類 最關鍵的區別:先看它是在比什麼,再看它怎麼做。

物件偵測 vs 影像分割 物件偵測:用框標位置 影像分割:逐像素標出物件範圍 最關鍵的區別:先看它是在比什麼,再看它怎麼做。

記住這句就好

不只判斷是什麼,還要知道在哪裡。

實際案例

交通監控 系統在路口找出車、人、腳踏車,再幫忙做流量統計。

零售貨架 相機拍到貨架後,模型找出缺貨商品和擺放位置。

算法與應用

物件偵測通常會產生候選框,再對每個框做分類與回歸。 訓練和評估時,IoU、mAP、和後處理都很關鍵。 它是電腦視覺裡很實用的一類任務,從監控到自駕都會用。

情境判斷

Q1(直覺題):你要找出照片裡有幾台車,而且每台車在哪裡,這屬於什麼? → 物件偵測。

Q2(判斷題):如果你只知道這張圖裡有狗,但不知道牠在哪,這算物件偵測嗎? → 不算,那只是影像分類。

相關術語

常見問題

物件偵測和分類差在哪?

分類只給類別,偵測還給位置。

它一定要用 CNN 嗎?

不一定,但 CNN 和其後代是很常見的視覺骨架。

它最常卡在哪裡?

小物件、遮擋、和密集場景都很難。