AD（異常偵測）是什麼？完整定義與解說

機器學習異常偵測

你有沒有在帳單裡看到一筆很怪的金額，或是感測器數值突然跳很高？

你可以把異常偵測想成從一堆正常資料裡找出不太一樣的點，這些點可能是錯誤、詐欺、故障或攻擊。它不是在分已知類別，而是在找「不應該出現的東西」。

這很重要，因為很多事故一開始都只是小異常，提早抓到就能避免後面變大問題。

容易混淆

異常偵測 vs 傳統分類

分類是把資料放進已知類別。

異常偵測是從正常資料裡找怪點。

最關鍵的區別：一個要已知標籤，一個常先沒有標籤。

異常偵測 vs 詐欺偵測

詐欺偵測是異常偵測的常見應用。

異常偵測的範圍更廣，包含設備故障、網路攻擊和資料錯誤。

最關鍵的區別：詐欺只是其中一種場景。

異常偵測 vs 資料漂移

資料漂移是資料分布變了。

異常偵測是找單筆或少數異常點。

最關鍵的區別：一個看整體變化，一個看局部怪點。

記住這句就好

在正常裡面找不正常，才是異常偵測。

實際案例

信用卡交易

如果凌晨突然出現一筆在陌生國家的大額交易，系統就會把它標成異常，提醒人工確認。

工廠感測器

機台溫度平常都在固定範圍，若某個感測器突然飆高，可能代表設備快壞了，這時就要提前處理。

算法與應用

常見方法

統計閾值、孤立森林、自編碼器、密度估計和一類分類，都是常見做法。

實務重點

異常很少見，所以資料不平衡通常很嚴重，光看準確率通常沒意義。

情境判斷

Q1（直覺題）： 一堆正常交易裡突然出現一筆很大的陌生金額，這算什麼？

→ 異常，因為它明顯偏離正常模式。

Q2（判斷題）： 只要模型把所有少見資料都當異常，就一定好嗎？

→ 不一定，這要看情況。若誤報太多，人工會被淹沒，真正的異常反而更難找。

常見問題

異常偵測一定要有標籤嗎？

不一定，很多時候正是因為沒有足夠標籤才要用它。

異常偵測和監控有什麼關係？

監控是持續看資料，異常偵測是監控裡常用的分析方法。

異常不一定是壞事嗎？

對，少數情況下它也可能是新趨勢或新事件，所以要結合情境判斷。

怎麼評估異常偵測？

常看精確率、召回率、F1 和誤報率，因為異常很少，單看準確率很容易騙人。

範例考題

某製造業工廠規劃導入 AI 監控系統，持續分析設備感測數據（如溫度、震動與壓力）。系統需能在缺乏完整異常標註資料的情況下，辨識與一般運作型態顯著不同的狀態，並觸發出預警。在此需求下，下列何種技術較為適合？

A. 使用支援向量機（Support Vector Machine, SVM）建立異常分類模型
B. 以決策樹（Decision Tree）學習異常類型的判斷規則
C. 採用變分自編碼器（Variational Autoencoder, VAE）學習正常資料分佈 ✓ 正確答案
D. 使用生成對抗網路（Generative Adversarial Network, GAN）直接預測異常標籤

解析：

在缺乏異常標註資料的情況下，VAE 可以透過學習正常資料的分佈來建立基準模型。當新資料偏離學習到的正常分佈時，即可判定為異常並觸發預警，屬於非監督式異常偵測方法。