解析:
CNN 的核心優勢是處理具有空間結構的資料,特別是影像。從倉庫監視器影像辨識貨架缺貨並標示位置,是典型的影像辨識/物件偵測任務,最適合使用 CNN。
物件偵測是一種電腦視覺技術,用於識別影像或影片中特定物件的位置和類別,常用於自動駕駛、安全監控、零售分析等。|本頁含完整原理、應用場景、iPAS 考試重點與 3 個常見問答。
你有沒有想過,AI 不只知道照片是什麼,還要知道物件在哪裡? 你可以把它想成在圖片上把每個目標框出來,再告訴你那是什麼類別。 物件偵測同時做分類和定位,所以比單純看整張圖難很多。 這也讓它很適合先拿到可用答案,再慢慢把精度往上推。 這種寫法常用在需要先把問題定義清楚,再逐步提升模型品質的場景。
物件偵測 vs 影像分類 物件偵測:找出物件位置和類別 影像分類:只判斷整張圖屬於哪一類 最關鍵的區別:先看它是在比什麼,再看它怎麼做。
物件偵測 vs 影像分割 物件偵測:用框標位置 影像分割:逐像素標出物件範圍 最關鍵的區別:先看它是在比什麼,再看它怎麼做。
不只判斷是什麼,還要知道在哪裡。
交通監控 系統在路口找出車、人、腳踏車,再幫忙做流量統計。
零售貨架 相機拍到貨架後,模型找出缺貨商品和擺放位置。
物件偵測通常會產生候選框,再對每個框做分類與回歸。 訓練和評估時,IoU、mAP、和後處理都很關鍵。 它是電腦視覺裡很實用的一類任務,從監控到自駕都會用。
Q1(直覺題): 你要找出照片裡有幾台車,而且每台車在哪裡,這屬於什麼?
Q2(判斷題): 如果你只知道這張圖裡有狗,但不知道牠在哪,這算物件偵測嗎?
分類只給類別,偵測還給位置。
不一定,但 CNN 和其後代是很常見的視覺骨架。
小物件、遮擋、和密集場景都很難。
某物流公司想導入 AI 以提升營運效率,評估不同資料型態與模型架構。下列哪一種應用情境最適合採用卷積神經網路(Convolutional Neural Network, CNN)作為主要模型架構?
解析:
CNN 的核心優勢是處理具有空間結構的資料,特別是影像。從倉庫監視器影像辨識貨架缺貨並標示位置,是典型的影像辨識/物件偵測任務,最適合使用 CNN。