物件偵測(Object Detection)是什麼?

物件偵測是一種電腦視覺技術,用於識別影像或影片中特定物件的位置和類別,常用於自動駕駛、安全監控、零售分析等。|本頁含完整原理、應用場景、iPAS 考試重點與 3 個常見問答。

物件偵測(Object Detection)是什麼? 電腦視覺深度學習

你有沒有想過,AI 不只知道照片是什麼,還要知道物件在哪裡? 你可以把它想成在圖片上把每個目標框出來,再告訴你那是什麼類別。 物件偵測同時做分類和定位,所以比單純看整張圖難很多。 這也讓它很適合先拿到可用答案,再慢慢把精度往上推。 這種寫法常用在需要先把問題定義清楚,再逐步提升模型品質的場景。

容易混淆

物件偵測 vs 影像分類 物件偵測:找出物件位置和類別 影像分類:只判斷整張圖屬於哪一類 最關鍵的區別:先看它是在比什麼,再看它怎麼做。

物件偵測 vs 影像分割 物件偵測:用框標位置 影像分割:逐像素標出物件範圍 最關鍵的區別:先看它是在比什麼,再看它怎麼做。

記住這句就好

不只判斷是什麼,還要知道在哪裡。

實際案例

交通監控 系統在路口找出車、人、腳踏車,再幫忙做流量統計。

零售貨架 相機拍到貨架後,模型找出缺貨商品和擺放位置。

算法與應用

物件偵測通常會產生候選框,再對每個框做分類與回歸。 訓練和評估時,IoU、mAP、和後處理都很關鍵。 它是電腦視覺裡很實用的一類任務,從監控到自駕都會用。

情境判斷

Q1(直覺題): 你要找出照片裡有幾台車,而且每台車在哪裡,這屬於什麼?

物件偵測。

Q2(判斷題): 如果你只知道這張圖裡有狗,但不知道牠在哪,這算物件偵測嗎?

不算,那只是影像分類。

常見問題

物件偵測和分類差在哪?

分類只給類別,偵測還給位置。

它一定要用 CNN 嗎?

不一定,但 CNN 和其後代是很常見的視覺骨架。

它最常卡在哪裡?

小物件、遮擋、和密集場景都很難。

範例考題

某物流公司想導入 AI 以提升營運效率,評估不同資料型態與模型架構。下列哪一種應用情境最適合採用卷積神經網路(Convolutional Neural Network, CNN)作為主要模型架構?

  • A. 依據包裹每日掃描紀錄的時間序列,預測下週各倉庫的進貨量波動
  • B. 根據客服對話逐句內容的先後順序,判斷客訴是否可能升級為申訴案件
  • C. 根據倉庫監視器影像,自動辨識貨架是否缺貨並標示缺貨區域位置 ✓ 正確答案
  • D. 依據車隊 GPS 路徑點的連續軌跡,預測下一段可能行駛路線

解析:

CNN 的核心優勢是處理具有空間結構的資料,特別是影像。從倉庫監視器影像辨識貨架缺貨並標示位置,是典型的影像辨識/物件偵測任務,最適合使用 CNN。