你有沒有想過,AI 不只看出這是貓,還能知道這是誰、在哪裡、在做什麼?
你可以把圖像識別想成對圖片做更廣義的辨認。 它比單純分類更進一步,會去認出物體、人物、場景或事件,常常還會牽涉位置資訊。
你可以把它想成一個把抽象概念拉回日常判斷的提示,先知道它解決什麼問題,再看技術細節。
容易混淆
圖像識別 vs 圖像分類 分類只關心整張圖的類別 識別的範圍更廣,可能包括人物、場景和位置 最關鍵的區別是整體分類,還是廣義辨認
圖像識別 vs 物件偵測 識別偏向知道是什麼 偵測還要知道在哪裡 最關鍵的區別是辨認本體,還是定位加辨認
記住這句就好
不只貼標籤,還要知道是什麼。
實際案例
相片搜尋 手機或雲端相簿可以靠圖像識別找出人臉、地點或特定物件。
門禁和安防 圖像識別常被用來辨認人員身份,協助門禁或監控系統。
算法與應用
圖像識別的範圍比圖像分類大,常和偵測、分割一起出現。 在實務上,模型好不好通常要看準確率、召回率和誤判成本。
情境判斷
Q1: 你要讓系統在照片裡找出某個人,會想到什麼? → 圖像識別,若還要畫框定位,則會進一步用物件偵測。
Q2: 你只要知道照片屬於哪一類,還需要完整識別嗎? → 不一定,只做圖像分類就夠了。
常見問題
圖像識別和物件偵測一樣嗎?
不一樣,物件偵測更重視位置。
它常用什麼模型?
CNN、遷移學習和更進階的視覺模型都常見。
有什麼限制?
光線、角度、遮擋和資料偏差都會影響結果。