iPAS AI 應用規劃師 中級 科目一

IoU 閾值越高代表什麼?

原題 07

在企業導入的智慧監控系統中,模型以物件偵測(Object Detection)方式自動辨識影像中的人物與車輛。若評估指標採用平均精確率(Mean Average Precision,mAP),其中 IoU(Intersection over Union)閾值設定較高時,代表下列哪一項意義?

白話

一家公司在工廠裝了智慧監控攝影機,AI 模型會自動在畫面上框出人和車,這就是「物件偵測」(Object Detection)。

要評估這個 AI 框得準不準,工程師用「mAP」這個指標打分數。mAP 裡有一個叫「IoU 閾值」的設定。

問你:把 IoU 閾值調高,代表什麼意思?

點選你的答案。

01 總結

一句話總結

IoU 閾值設定較高,代表評估標準更嚴格:只有當預測框與真實框的重疊面積夠高,才算「框對了」,因此 mAP 較高的模型代表偵測結果更精準

02 情境

先感受問題:框得差不多算不算?

想像「智安科技」在工廠出入口裝了 AI 攝影機,任務是偵測每個進入廠區的人員,AI 會在畫面上畫一個「預測框」(紅色框),工程師也會手動標一個「標準答案框」(綠色框)。

問題來了:AI 框的位置和標準答案框的位置「差多少才算過關」?這個「及格線」就是 IoU 閾值。

IoU(Intersection over Union,交聯比)= 兩個框的交集面積 ÷ 兩個框的聯集面積
值域 0 到 1:0 代表完全不重疊,1 代表完美重疊

閾值設 0.5 時:只要紅框和綠框有 50% 以上重疊,就算「偵測成功」。

閾值設 0.75 時:要有 75% 以上重疊才算成功,標準嚴了很多。

所以閾值越高,代表「只有框得很準的偵測才被承認」,這就是選項 A 說的:重疊程度要求越高,代表模型偵測結果越精準。

03 對照

如果沒有 IoU,評估會踩哪些坑?

  1. 框偏了也算對:只要框到任何一點人體像素就說「偵測到了」,但框的位置可能差了半個身體寬度,實際毫無用處。
  2. 無法比較兩個模型誰更準:模型 A 框得差不多、模型 B 框得精準,如果沒有重疊標準,兩個都說「100% 偵測到」,看不出差距。
  3. 偵測大目標很容易作弊:車子很大,框得歪掉還是有一大片重疊,沒有閾值的話每次都能過關,但框一個小孩就露餡了。
  4. 多類別比較失去意義:人、車、安全帽各自大小不同,如果沒有統一的重疊標準,跨類別的 mAP 比較就沒有意義。
  5. 工程師無法設定驗收標準:客戶要求「框準到可以做人臉比對」,工程師說不出「我們 IoU 0.8 以上才算過關」,驗收沒有依據。
04 解法

IoU 閾值就是「及格線」:越高代表要求越嚴

智安科技的工程師決定用 mAP@0.75 作為驗收標準,意思是「只有預測框和標準答案框重疊超過 75%,這次偵測才算成功」。

具體流程:

步驟一:AI 在影像上畫出預測框,同時記錄信心分數(例如「90% 確定這是人」)。

步驟二:計算預測框和標準答案框的 IoU。如果 IoU ≥ 0.75,標記為「True Positive(真陽性)」;低於 0.75,標記為「False Positive(假陽性)」。

步驟三:根據 True Positive 和 False Positive 算出 Precision-Recall 曲線,曲線下面積就是「Average Precision(AP)」;對所有類別取平均就是「mAP」。

所以當我們說「IoU 閾值設定較高」,意思就是「及格線拉高了,只有框得非常準的偵測才能被記為成功」,這直接代表模型的偵測結果要求更精準。

這就是選項 A 講的:預測邊界框與真實邊界框的重疊程度越高,模型偵測結果越精準

技術版:mAP 與 IoU 的數學關係

中級考試大概率會考程式碼跟公式,所以這部分你還是要學。但如果現在學起來很痛苦,可以先跳過,等讀完其他題目回頭再來。

Step 1 純故事版(不出現公式)

把 AI 的偵測想成射箭比賽。靶心(紅圈)是標準答案框,箭落的位置是預測框。

規則 A(IoU=0.5):只要射進外圈就算中。很多人都能過。

規則 B(IoU=0.75):要射進中圈才算中。要求更高,只有技術好的弓箭手才過。

比賽得分(mAP)是根據「中靶次數」算出來的,規則越嚴,能拿到高分的人越少,但能拿高分的人真的很準。

Step 2 中文 ↔ 公式對照
白話說法公式符號
預測框和標準框的交集面積Area(B_pred ∩ B_gt)
預測框和標準框的聯集面積Area(B_pred ∪ B_gt)
兩框重疊比例IoU = Area(∩) / Area(∪)
這次偵測算不算成功IoU ≥ threshold → TP;IoU < threshold → FP
某類別的平均精確率AP = ∫ P(r) dr(Precision-Recall 曲線下面積)
所有類別平均mAP = (1/N) Σ AP_i
Step 3 符號角色表
B_pred
AI 畫出的預測邊界框(Bounding Box)
B_gt
人工標記的標準答案框(Ground Truth Box)
IoU
交聯比,衡量兩框重疊程度,值域 [0, 1]
threshold(閾值)
及格線,常見值 0.5 / 0.75,也可以寫 mAP@0.5:0.95 表示多個閾值取平均
TP
True Positive,IoU 達標且類別正確
FP
False Positive,IoU 未達標或類別錯誤
AP
Average Precision,單一類別的精確率-召回率曲線下面積
mAP
Mean Average Precision,所有類別 AP 的平均值
Step 4 完整公式拆解
IoU = |B_pred ∩ B_gt| / |B_pred ∪ B_gt|

其中:
|B_pred ∪ B_gt| = |B_pred| + |B_gt| - |B_pred ∩ B_gt|

mAP@t = (1/C) × Σ_{i=1}^{C} AP_i(t)

AP_i(t) = Σ_{k} [P(k) × ΔR(k)]
(P(k) = 在第 k 個 recall 點的 precision,ΔR(k) = recall 的增量)
Step 5 自我複述

蓋住上面的公式,試著用自己的話說出:

  1. IoU 的分子和分母分別是什麼?
  2. 為什麼聯集面積 = 兩框面積相加再減去交集?
  3. IoU 閾值從 0.5 提高到 0.75,TP 的數量會變多還是變少?
  4. TP 數量減少,AP 會怎麼變化?
  5. mAP@0.5 和 mAP@0.75,哪個更嚴格、通常數值更低?
05 陷阱

為什麼其他選項是錯的

選項 B 誤差越大導致 mAP 上升

字面在說什麼:閾值提高時,預測框和標準框的誤差變大,但 mAP 反而因此升高。

為什麼不對:這是完全顛倒的邏輯。IoU 閾值提高,代表容許的誤差更小(重疊要求更高)。誤差越大,IoU 越低,越難達到高閾值,mAP 不會上升反而會下降。

誰會選錯:把「閾值高」和「數值大」混在一起想,以為閾值是衡量誤差大小的人。實際上 IoU 閾值是「要求的最低及格線」,閾值高代表標準嚴,不是誤差大。

選項 C Precision 降低但 Recall 上升

字面在說什麼:調高 IoU 閾值後,整體精確率下降,但召回率反而提高。

為什麼不對:實際上,閾值越高,更多的預測框被判為 FP(因為達不到高 IoU),所以 Precision 確實可能下降。但 Recall 也會一起下降,因為符合高閾值的 TP 變少了。不存在「Precision 降、Recall 升」這種同步反向移動。

誰會選錯:把 IoU 閾值和 Precision-Recall 的 tradeoff 曲線混淆的人。Precision-Recall 的 tradeoff 是靠「信心分數閾值」調整,不是靠 IoU 閾值。

選項 D 評估結果不受真實框大小影響

字面在說什麼:IoU 閾值高時,評估就不在乎標準答案框的大小了。

為什麼不對:IoU 計算時分母是聯集面積,而聯集面積和兩個框的大小直接相關。框越大,IoU 計算結果就越受影響。這個選項是無中生有,IoU 本身就包含框的大小資訊。

誰會選錯:沒有看過 IoU 公式的人,可能以為「閾值」是某種正規化操作,讓尺度變得無關。實際上 IoU 本來就是面積比,尺度始終在計算裡。

06 變形

同個考點下次怎麼變形

變形 1 邊界

直覺:如果 IoU 閾值設為 1.0,任何模型都能達到高 mAP 嗎?

答案:不能。IoU = 1.0 代表預測框和標準框必須完全重疊(像素對像素),這在現實中幾乎不可能達到,mAP 會接近 0。所以實務上閾值不會設這麼高,常用 0.5 或 0.5:0.05:0.95 的範圍平均。

變形 2 反例

直覺:一個模型 mAP@0.5 = 0.85,mAP@0.75 = 0.40,這代表什麼問題?

答案:代表這個模型能框到大致位置(50% 重疊通過),但框得不夠精準(75% 重疊通過率很低)。這種模型在「大致偵測有沒有目標」的任務還好,但用於人臉辨識或精準尺量就不夠用。

變形 3 升級版

直覺:COCO 資料集用 mAP@0.5:0.05:0.95,這是什麼意思?

答案:從 IoU=0.50 到 IoU=0.95,每隔 0.05 算一次 mAP,共 10 個閾值取平均。這樣可以同時衡量「框大概在哪」和「框的精確程度」,比單一閾值更全面。是目前物件偵測最常用的評估方式。

變形 4 跨領域

直覺:醫療影像 AI 偵測腫瘤,IoU 閾值應該設高還是低?

答案:應該設高(如 0.7~0.9)。醫療場景中,框的位置關係到手術切除範圍,差一點就可能切錯組織。容許度比一般監控場景低很多,所以閾值要嚴格。這正好說明 IoU 閾值的設定本身就是一個「風險容忍度」的商業決策。

變形 5 評估指標

直覺:mAP 和 Accuracy(準確率)有什麼差?用 Accuracy 評估物件偵測可以嗎?

答案:不可以。Accuracy 的分母是所有樣本數,但物件偵測的「樣本」是每個偵測框,背景框數量遠多於目標框,直接算 Accuracy 會因為「大多數背景都猜對了」而虛高。mAP 用 Precision-Recall 曲線規避了這個問題,只關注「模型有沒有偵測到目標,且框對了位置」。

07 延伸

想再往下看,這 5 個

出處

iPAS 經濟部產業人才能力鑑定 ・ 114 年第二次 iPAS AI 應用規劃師 中級 科目一 第 7 題

查看官方原文 PDF