解析:
在缺乏異常標註資料的情況下,VAE 可以透過學習正常資料的分佈來建立基準模型。當新資料偏離學習到的正常分佈時,即可判定為異常並觸發預警,屬於非監督式異常偵測方法。
異常偵測是指識別數據集中與預期模式顯著不同的數據點,這些異常點可能指示錯誤、欺詐或其他不尋常的事件。|本頁含完整原理、應用場景、iPAS 考試重點與 4 個常見問答。
你有沒有在帳單裡看到一筆很怪的金額,或是感測器數值突然跳很高?
你可以把異常偵測想成從一堆正常資料裡找出不太一樣的點,這些點可能是錯誤、詐欺、故障或攻擊。它不是在分已知類別,而是在找「不應該出現的東西」。
這很重要,因為很多事故一開始都只是小異常,提早抓到就能避免後面變大問題。
異常偵測 vs 傳統分類
分類是把資料放進已知類別。
異常偵測是從正常資料裡找怪點。
最關鍵的區別:一個要已知標籤,一個常先沒有標籤。
異常偵測 vs 詐欺偵測
詐欺偵測是異常偵測的常見應用。
異常偵測的範圍更廣,包含設備故障、網路攻擊和資料錯誤。
最關鍵的區別:詐欺只是其中一種場景。
異常偵測 vs 資料漂移
資料漂移是資料分布變了。
異常偵測是找單筆或少數異常點。
最關鍵的區別:一個看整體變化,一個看局部怪點。
在正常裡面找不正常,才是異常偵測。
信用卡交易
如果凌晨突然出現一筆在陌生國家的大額交易,系統就會把它標成異常,提醒人工確認。
工廠感測器
機台溫度平常都在固定範圍,若某個感測器突然飆高,可能代表設備快壞了,這時就要提前處理。
常見方法
統計閾值、孤立森林、自編碼器、密度估計和一類分類,都是常見做法。
實務重點
異常很少見,所以資料不平衡通常很嚴重,光看準確率通常沒意義。
Q1(直覺題): 一堆正常交易裡突然出現一筆很大的陌生金額,這算什麼?
→ 異常,因為它明顯偏離正常模式。
Q2(判斷題): 只要模型把所有少見資料都當異常,就一定好嗎?
→ 不一定,這要看情況。若誤報太多,人工會被淹沒,真正的異常反而更難找。
不一定,很多時候正是因為沒有足夠標籤才要用它。
監控是持續看資料,異常偵測是監控裡常用的分析方法。
對,少數情況下它也可能是新趨勢或新事件,所以要結合情境判斷。
常看精確率、召回率、F1 和誤報率,因為異常很少,單看準確率很容易騙人。
某製造業工廠規劃導入 AI 監控系統,持續分析設備感測數據(如溫度、震動與壓力)。系統需能在缺乏完整異常標註資料的情況下,辨識與一般運作型態顯著不同的狀態,並觸發出預警。在此需求下,下列何種技術較為適合?
解析:
在缺乏異常標註資料的情況下,VAE 可以透過學習正常資料的分佈來建立基準模型。當新資料偏離學習到的正常分佈時,即可判定為異常並觸發預警,屬於非監督式異常偵測方法。