物件偵測 是什麼?
Object Detection — 物件偵測 的完整解釋
物件偵測是一種電腦視覺技術,用於識別影像或影片中特定物件的位置和類別,常用於自動駕駛、安全監控、零售分析等。
容易混淆
物件偵測 vs 影像分類 物件偵測:找出物件位置和類別 影像分類:只判斷整張圖屬於哪一類 最關鍵的區別:先看它是在比什麼,再看它怎麼做。
物件偵測 vs 影像分割 物件偵測:用框標位置 影像分割:逐像素標出物件範圍 最關鍵的區別:先看它是在比什麼,再看它怎麼做。
記住這句就好
不只判斷是什麼,還要知道在哪裡。
實際案例
交通監控 系統在路口找出車、人、腳踏車,再幫忙做流量統計。
零售貨架 相機拍到貨架後,模型找出缺貨商品和擺放位置。
算法與應用
物件偵測通常會產生候選框,再對每個框做分類與回歸。 訓練和評估時,IoU、mAP、和後處理都很關鍵。 它是電腦視覺裡很實用的一類任務,從監控到自駕都會用。
情境判斷
Q1(直覺題):你要找出照片裡有幾台車,而且每台車在哪裡,這屬於什麼? → 物件偵測。
Q2(判斷題):如果你只知道這張圖裡有狗,但不知道牠在哪,這算物件偵測嗎? → 不算,那只是影像分類。
相關術語
常見問題
物件偵測和分類差在哪?
分類只給類別,偵測還給位置。
它一定要用 CNN 嗎?
不一定,但 CNN 和其後代是很常見的視覺骨架。
它最常卡在哪裡?
小物件、遮擋、和密集場景都很難。