電腦視覺 是什麼?
Computer Vision — 電腦視覺 的完整解釋
電腦視覺(Computer Vision)讓 AI 從圖像與影片中辨識物件、文字、人臉,廣泛用於自駕車、人臉辨識、醫療影像分析、工廠瑕疵檢測。
容易混淆
電腦視覺 vs 圖像處理 vs 影像辨識
電腦視覺:讓電腦理解影像內容並做判斷
圖像處理:改善影像品質,例如去噪、銳化、調色
影像辨識:偏向判斷圖中是什麼物件或類別
最關鍵的區別:圖像處理是在修圖,電腦視覺是在理解畫面。
記住這句就好
影像處理是修照片,電腦視覺是看懂照片。
實際案例
醫療影像判讀
前:醫師要一張張看 X 光與 MRI,時間長又容易疲勞
後:模型先標出可疑區域,幫醫師縮小範圍,再做最後判讀
產線瑕疵檢測
前:靠人工目視檢查,速度慢而且標準不一致
後:相機搭配模型自動找出刮痕、缺角和顏色異常,快速分流處理
算法與應用
電腦視覺常用卷積神經網路、目標偵測、影像分割與姿態估計等方法
它也會和深度學習、擴散模型、注意力機制結合,延伸到生成、理解和多模態任務
實務上,資料標註品質、光線變化和拍攝角度,往往比模型選型更影響效果
情境判斷
Q1(直覺題): 看到相機能自動辨識車牌,這比較像電腦視覺嗎?
→ 是。因為它是在從影像中抓出文字與位置資訊。
Q2(判斷題): 如果相機模型把照片顏色修得很好,但還是不知道畫面裡是什麼,算成功的電腦視覺嗎?
→ 不算完整成功。那只是圖像處理效果好,還沒有真正做到理解內容。
電腦視覺 在 iPAS 考試中的重點
根據歷年統計,電腦視覺 相關題目 平均佔 AI 技術類考題 7%, 屬於高頻考範圍。
常見出題方向:應用場景識別與分析(45%)、技術整合方案設計(35%)、實務應用案例判斷(20%)。
相關術語
常見問題
電腦視覺一定要深度學習嗎?
不一定,傳統影像方法還在很多場景使用,只是現在深度學習更常見。
電腦視覺能不能只做圖片,不做影片?
可以,但影片其實是連續影像,所以很多方法也能延伸到動作與時序分析。
電腦視覺和多模態 AI 有什麼關係?
多模態 AI 會把影像和文字一起處理,電腦視覺就是其中的視覺部分。
為什麼影像資料這麼難做?
因為光線、角度、遮擋和背景變化都很大,資料品質很容易影響模型。
資料來源
- iPAS AI 應用規劃師評鑑內容範圍參考(115.02) — 經濟部產業人才能力鑑定