電腦視覺 是什麼?

Computer Vision — 電腦視覺 的完整解釋

電腦視覺(Computer Vision)讓 AI 從圖像與影片中辨識物件、文字、人臉,廣泛用於自駕車、人臉辨識、醫療影像分析、工廠瑕疵檢測。

容易混淆

電腦視覺 vs 圖像處理 vs 影像辨識

電腦視覺:讓電腦理解影像內容並做判斷

圖像處理:改善影像品質,例如去噪、銳化、調色

影像辨識:偏向判斷圖中是什麼物件或類別

最關鍵的區別:圖像處理是在修圖,電腦視覺是在理解畫面。

記住這句就好

影像處理是修照片,電腦視覺是看懂照片。

實際案例

醫療影像判讀

前:醫師要一張張看 X 光與 MRI,時間長又容易疲勞

後:模型先標出可疑區域,幫醫師縮小範圍,再做最後判讀

產線瑕疵檢測

前:靠人工目視檢查,速度慢而且標準不一致

後:相機搭配模型自動找出刮痕、缺角和顏色異常,快速分流處理

算法與應用

電腦視覺常用卷積神經網路、目標偵測、影像分割與姿態估計等方法

它也會和深度學習、擴散模型、注意力機制結合,延伸到生成、理解和多模態任務

實務上,資料標註品質、光線變化和拍攝角度,往往比模型選型更影響效果

情境判斷

Q1(直覺題): 看到相機能自動辨識車牌,這比較像電腦視覺嗎?

→ 是。因為它是在從影像中抓出文字與位置資訊。

Q2(判斷題): 如果相機模型把照片顏色修得很好,但還是不知道畫面裡是什麼,算成功的電腦視覺嗎?

→ 不算完整成功。那只是圖像處理效果好,還沒有真正做到理解內容。

電腦視覺 在 iPAS 考試中的重點

根據歷年統計,電腦視覺 相關題目 平均佔 AI 技術類考題 7%, 屬於高頻考範圍。

常見出題方向:應用場景識別與分析(45%)、技術整合方案設計(35%)、實務應用案例判斷(20%)。

相關術語

常見問題

電腦視覺一定要深度學習嗎?

不一定,傳統影像方法還在很多場景使用,只是現在深度學習更常見。

電腦視覺能不能只做圖片,不做影片?

可以,但影片其實是連續影像,所以很多方法也能延伸到動作與時序分析。

電腦視覺和多模態 AI 有什麼關係?

多模態 AI 會把影像和文字一起處理,電腦視覺就是其中的視覺部分。

為什麼影像資料這麼難做?

因為光線、角度、遮擋和背景變化都很大,資料品質很容易影響模型。

資料來源

← 回到 電腦視覺 快查頁

測驗你對 電腦視覺 的理解

透過模擬考系統檢驗學習成果

開始測驗