iPAS AI 應用規劃師中級　科目一

IoU 閾值越高代表什麼？

原題 07

在企業導入的智慧監控系統中，模型以物件偵測（Object Detection）方式自動辨識影像中的人物與車輛。若評估指標採用平均精確率（Mean Average Precision，mAP），其中 IoU（Intersection over Union）閾值設定較高時，代表下列哪一項意義？

白話

一家公司在工廠裝了智慧監控攝影機，AI 模型會自動在畫面上框出人和車，這就是「物件偵測」（Object Detection）。

要評估這個 AI 框得準不準，工程師用「mAP」這個指標打分數。mAP 裡有一個叫「IoU 閾值」的設定。

問你：把 IoU 閾值調高，代表什麼意思？

點選你的答案。

← 回 50 題列表回 iPAS 備考總覽

01　總結

一句話總結

IoU 閾值設定較高，代表評估標準更嚴格：只有當預測框與真實框的重疊面積夠高，才算「框對了」，因此 mAP 較高的模型代表偵測結果更精準。

02　情境

先感受問題：框得差不多算不算？

想像「智安科技」在工廠出入口裝了 AI 攝影機，任務是偵測每個進入廠區的人員，AI 會在畫面上畫一個「預測框」（紅色框），工程師也會手動標一個「標準答案框」（綠色框）。

問題來了：AI 框的位置和標準答案框的位置「差多少才算過關」？這個「及格線」就是 IoU 閾值。

IoU（Intersection over Union，交聯比）= 兩個框的交集面積 ÷ 兩個框的聯集面積
值域 0 到 1：0 代表完全不重疊，1 代表完美重疊

閾值設 0.5 時：只要紅框和綠框有 50% 以上重疊，就算「偵測成功」。

閾值設 0.75 時：要有 75% 以上重疊才算成功，標準嚴了很多。

所以閾值越高，代表「只有框得很準的偵測才被承認」，這就是選項 A 說的：重疊程度要求越高，代表模型偵測結果越精準。

03　對照

如果沒有 IoU，評估會踩哪些坑？

框偏了也算對：只要框到任何一點人體像素就說「偵測到了」，但框的位置可能差了半個身體寬度，實際毫無用處。
無法比較兩個模型誰更準：模型 A 框得差不多、模型 B 框得精準，如果沒有重疊標準，兩個都說「100% 偵測到」，看不出差距。
偵測大目標很容易作弊：車子很大，框得歪掉還是有一大片重疊，沒有閾值的話每次都能過關，但框一個小孩就露餡了。
多類別比較失去意義：人、車、安全帽各自大小不同，如果沒有統一的重疊標準，跨類別的 mAP 比較就沒有意義。
工程師無法設定驗收標準：客戶要求「框準到可以做人臉比對」，工程師說不出「我們 IoU 0.8 以上才算過關」，驗收沒有依據。

04　解法

IoU 閾值就是「及格線」：越高代表要求越嚴

智安科技的工程師決定用 mAP@0.75 作為驗收標準，意思是「只有預測框和標準答案框重疊超過 75%，這次偵測才算成功」。

具體流程：

步驟一：AI 在影像上畫出預測框，同時記錄信心分數（例如「90% 確定這是人」）。

步驟二：計算預測框和標準答案框的 IoU。如果 IoU ≥ 0.75，標記為「True Positive（真陽性）」；低於 0.75，標記為「False Positive（假陽性）」。

步驟三：根據 True Positive 和 False Positive 算出 Precision-Recall 曲線，曲線下面積就是「Average Precision（AP）」；對所有類別取平均就是「mAP」。

所以當我們說「IoU 閾值設定較高」，意思就是「及格線拉高了，只有框得非常準的偵測才能被記為成功」，這直接代表模型的偵測結果要求更精準。

這就是選項 A 講的：預測邊界框與真實邊界框的重疊程度越高，模型偵測結果越精準。

技術版：mAP 與 IoU 的數學關係

中級考試大概率會考程式碼跟公式，所以這部分你還是要學。但如果現在學起來很痛苦，可以先跳過，等讀完其他題目回頭再來。

Step 1 純故事版（不出現公式）

把 AI 的偵測想成射箭比賽。靶心（紅圈）是標準答案框，箭落的位置是預測框。

規則 A（IoU=0.5）：只要射進外圈就算中。很多人都能過。

規則 B（IoU=0.75）：要射進中圈才算中。要求更高，只有技術好的弓箭手才過。

比賽得分（mAP）是根據「中靶次數」算出來的，規則越嚴，能拿到高分的人越少，但能拿高分的人真的很準。

Step 2 中文 ↔ 公式對照

白話說法	公式符號
預測框和標準框的交集面積	Area(B_pred ∩ B_gt)
預測框和標準框的聯集面積	Area(B_pred ∪ B_gt)
兩框重疊比例	IoU = Area(∩) / Area(∪)
這次偵測算不算成功	IoU ≥ threshold → TP；IoU < threshold → FP
某類別的平均精確率	AP = ∫ P(r) dr（Precision-Recall 曲線下面積）
所有類別平均	mAP = (1/N) Σ AP_i

Step 3 符號角色表

B_pred: AI 畫出的預測邊界框（Bounding Box）
B_gt: 人工標記的標準答案框（Ground Truth Box）
IoU: 交聯比，衡量兩框重疊程度，值域 [0, 1]
threshold（閾值）: 及格線，常見值 0.5 / 0.75，也可以寫 mAP@0.5:0.95 表示多個閾值取平均
TP: True Positive，IoU 達標且類別正確
FP: False Positive，IoU 未達標或類別錯誤
AP: Average Precision，單一類別的精確率-召回率曲線下面積
mAP: Mean Average Precision，所有類別 AP 的平均值

Step 4 完整公式拆解

IoU = |B_pred ∩ B_gt| / |B_pred ∪ B_gt|

其中：
|B_pred ∪ B_gt| = |B_pred| + |B_gt| - |B_pred ∩ B_gt|

mAP@t = (1/C) × Σ_{i=1}^{C} AP_i(t)

AP_i(t) = Σ_{k} [P(k) × ΔR(k)]
（P(k) = 在第 k 個 recall 點的 precision，ΔR(k) = recall 的增量）

Step 5 自我複述

蓋住上面的公式，試著用自己的話說出：

IoU 的分子和分母分別是什麼？
為什麼聯集面積 = 兩框面積相加再減去交集？
IoU 閾值從 0.5 提高到 0.75，TP 的數量會變多還是變少？
TP 數量減少，AP 會怎麼變化？
mAP@0.5 和 mAP@0.75，哪個更嚴格、通常數值更低？

05　陷阱

為什麼其他選項是錯的

選項 B　誤差越大導致 mAP 上升

字面在說什麼：閾值提高時，預測框和標準框的誤差變大，但 mAP 反而因此升高。

為什麼不對：這是完全顛倒的邏輯。IoU 閾值提高，代表容許的誤差更小（重疊要求更高）。誤差越大，IoU 越低，越難達到高閾值，mAP 不會上升反而會下降。

誰會選錯：把「閾值高」和「數值大」混在一起想，以為閾值是衡量誤差大小的人。實際上 IoU 閾值是「要求的最低及格線」，閾值高代表標準嚴，不是誤差大。

選項 C　Precision 降低但 Recall 上升

字面在說什麼：調高 IoU 閾值後，整體精確率下降，但召回率反而提高。

為什麼不對：實際上，閾值越高，更多的預測框被判為 FP（因為達不到高 IoU），所以 Precision 確實可能下降。但 Recall 也會一起下降，因為符合高閾值的 TP 變少了。不存在「Precision 降、Recall 升」這種同步反向移動。

誰會選錯：把 IoU 閾值和 Precision-Recall 的 tradeoff 曲線混淆的人。Precision-Recall 的 tradeoff 是靠「信心分數閾值」調整，不是靠 IoU 閾值。

選項 D　評估結果不受真實框大小影響

字面在說什麼：IoU 閾值高時，評估就不在乎標準答案框的大小了。

為什麼不對：IoU 計算時分母是聯集面積，而聯集面積和兩個框的大小直接相關。框越大，IoU 計算結果就越受影響。這個選項是無中生有，IoU 本身就包含框的大小資訊。

誰會選錯：沒有看過 IoU 公式的人，可能以為「閾值」是某種正規化操作，讓尺度變得無關。實際上 IoU 本來就是面積比，尺度始終在計算裡。

06　變形

同個考點下次怎麼變形

變形 1　邊界

直覺：如果 IoU 閾值設為 1.0，任何模型都能達到高 mAP 嗎？

答案：不能。IoU = 1.0 代表預測框和標準框必須完全重疊（像素對像素），這在現實中幾乎不可能達到，mAP 會接近 0。所以實務上閾值不會設這麼高，常用 0.5 或 0.5:0.05:0.95 的範圍平均。

變形 2　反例

直覺：一個模型 mAP@0.5 = 0.85，mAP@0.75 = 0.40，這代表什麼問題？

答案：代表這個模型能框到大致位置（50% 重疊通過），但框得不夠精準（75% 重疊通過率很低）。這種模型在「大致偵測有沒有目標」的任務還好，但用於人臉辨識或精準尺量就不夠用。

變形 3　升級版

直覺：COCO 資料集用 mAP@0.5:0.05:0.95，這是什麼意思？

答案：從 IoU=0.50 到 IoU=0.95，每隔 0.05 算一次 mAP，共 10 個閾值取平均。這樣可以同時衡量「框大概在哪」和「框的精確程度」，比單一閾值更全面。是目前物件偵測最常用的評估方式。

變形 4　跨領域

直覺：醫療影像 AI 偵測腫瘤，IoU 閾值應該設高還是低？

答案：應該設高（如 0.7~0.9）。醫療場景中，框的位置關係到手術切除範圍，差一點就可能切錯組織。容許度比一般監控場景低很多，所以閾值要嚴格。這正好說明 IoU 閾值的設定本身就是一個「風險容忍度」的商業決策。

變形 5　評估指標

直覺：mAP 和 Accuracy（準確率）有什麼差？用 Accuracy 評估物件偵測可以嗎？

答案：不可以。Accuracy 的分母是所有樣本數，但物件偵測的「樣本」是每個偵測框，背景框數量遠多於目標框，直接算 Accuracy 會因為「大多數背景都猜對了」而虛高。mAP 用 Precision-Recall 曲線規避了這個問題，只關注「模型有沒有偵測到目標，且框對了位置」。

07　延伸

想再往下看，這 5 個

交並比（Intersection over Union）核心考點：衡量預測框與真實框重疊程度的指標，IoU 閾值越高代表對框的精準度要求越嚴格。
物件偵測（Object Detection）題目情境的核心任務，同時在影像中定位目標位置並辨識類別，mAP 是其標準評估指標。
非極大值抑制（Non-Maximum Suppression）物件偵測的後處理步驟，用 IoU 判斷重疊框是否偵測同一目標，僅保留信心最高的框。
精確率（Precision）mAP 計算的基礎指標之一，IoU 閾值調高時，原本被算作正確的預測框可能變成錯誤，影響 Precision 值。
邊界框偵測（Bounding Box）物件偵測輸出的定位格式，IoU 正是用來衡量預測邊界框與標注邊界框重疊程度的上位概念。