OD（物件偵測）是什麼？完整定義與解說

分類只給類別，偵測還給位置。

小物件、遮擋、和密集場景都很難。

電腦視覺深度學習

你有沒有想過，AI 不只知道照片是什麼，還要知道物件在哪裡？ 你可以把它想成在圖片上把每個目標框出來，再告訴你那是什麼類別。物件偵測同時做分類和定位，所以比單純看整張圖難很多。這也讓它很適合先拿到可用答案，再慢慢把精度往上推。這種寫法常用在需要先把問題定義清楚，再逐步提升模型品質的場景。

容易混淆

物件偵測 vs 影像分類 物件偵測：找出物件位置和類別影像分類：只判斷整張圖屬於哪一類最關鍵的區別：先看它是在比什麼，再看它怎麼做。

物件偵測 vs 影像分割 物件偵測：用框標位置影像分割：逐像素標出物件範圍最關鍵的區別：先看它是在比什麼，再看它怎麼做。

不只判斷是什麼，還要知道在哪裡。

交通監控 系統在路口找出車、人、腳踏車，再幫忙做流量統計。

零售貨架 相機拍到貨架後，模型找出缺貨商品和擺放位置。

物件偵測通常會產生候選框，再對每個框做分類與回歸。訓練和評估時，IoU、mAP、和後處理都很關鍵。它是電腦視覺裡很實用的一類任務，從監控到自駕都會用。

Q1（直覺題）： 你要找出照片裡有幾台車，而且每台車在哪裡，這屬於什麼？

物件偵測。

Q2（判斷題）： 如果你只知道這張圖裡有狗，但不知道牠在哪，這算物件偵測嗎？

不算，那只是影像分類。

物件偵測和分類差在哪？

分類只給類別，偵測還給位置。

它一定要用 CNN 嗎？

不一定，但 CNN 和其後代是很常見的視覺骨架。

它最常卡在哪裡？

小物件、遮擋、和密集場景都很難。

某物流公司想導入 AI 以提升營運效率，評估不同資料型態與模型架構。下列哪一種應用情境最適合採用卷積神經網路（Convolutional Neural Network, CNN）作為主要模型架構？

解析：

CNN 的核心優勢是處理具有空間結構的資料，特別是影像。從倉庫監視器影像辨識貨架缺貨並標示位置，是典型的影像辨識/物件偵測任務，最適合使用 CNN。