iPAS AI 應用規劃師初級　科目二　生成式 AI 應用與規劃

洗錢偵測最適合哪種生成式 AI 技術？

原題 26

某支付平台為了強化洗錢行為檢測，計劃導入生成式 AI 技術來輔助分析可疑交易模式。該平台擁有大量歷史交易記錄和已知洗錢案例資料，希望 AI 能自動生成可疑交易的特徵描述報告。下列哪一種生成式 AI 技術最適合此需求？

白話

某支付平台手上有大量歷史交易紀錄和已知洗錢案例資料，想導入生成式 AI 技術，讓 AI 能自動生成可疑交易的特徵描述報告。

問你：哪一種生成式 AI 技術最適合這個需求？

點選你的答案。

← 回 50 題列表回 iPAS 備考總覽

01　總結

一句話總結

有「既有案例資料庫」加上「需要生成有根據的分析報告」，這是 RAG（檢索增強生成） 的典型應用場景，讓 AI 先查案例再生成報告。

02　情境

先感受問題：分析師要寫可疑交易報告，但案例資料庫太大看不完

假設你在「永興支付」的風控團隊工作。公司累積了五年的交易記錄和 3,000 筆已確認的洗錢案例，每個案例都有詳細的模式描述。

每當偵測系統標記一筆可疑交易，風控分析師要寫一份報告，說明「這筆交易為什麼可疑、跟哪些已知洗錢手法相似」。問題是：資料庫太大，分析師沒辦法每次都手動翻 3,000 筆案例，報告品質參差不齊。

你需要的 AI 能做兩件事：先從案例資料庫找出最相關的歷史案例，再根據這些案例生成有根據的特徵描述報告。這不是讓 AI 憑空猜測，而是讓 AI 有憑有據地引用既有知識。

03　對照

沒有 RAG，只用 ChatGPT 直接分析會怎樣？

如果「永興支付」直接用 ChatGPT 基礎模型做分析，會碰到這些問題：

沒有公司專屬資料：ChatGPT 的訓練資料不包含「永興支付」的歷史洗錢案例，回答只能靠一般知識，沒有針對性
知識截止日期：ChatGPT 有知識截止日期，最新的洗錢手法可能還不知道，但公司資料庫都有
無法引用具體案例：報告寫「這筆交易與 2023 年 8 月案例 #2847 模式相似」，ChatGPT 沒有這份資料根本做不到
幻覺問題：在缺乏真實資料的情況下，ChatGPT 可能生成看起來合理但實際上錯誤的分析內容
合規問題：洗錢防制報告需要有憑有據，沒有引用真實案例的分析報告難以通過法遵審查

04　解法

RAG 怎麼解

RAG（Retrieval-Augmented Generation，檢索增強生成）的工作方式：

第一步：建立向量資料庫。把「永興支付」的 3,000 筆洗錢案例和歷史交易記錄，轉換成向量（Embedding），存進向量資料庫。每個案例都能用語意搜尋找到。

第二步：檢索（Retrieval）。當有一筆可疑交易進來，系統先從向量資料庫找出最相似的歷史案例，比如「找出跟這筆交易模式最像的前 5 個洗錢案例」。

第三步：增強生成（Augmented Generation）。把找到的案例連同可疑交易資料，一起送進語言模型，讓它生成「有具體案例支撐的特徵描述報告」。

這樣生成的報告不是 AI 憑空想像，而是有真實案例根據，滿足合規要求，也更有說服力。

這就是選項 C 講的：運用 RAG 檢索增強生成技術結合歷史案例資料庫。

技術版：RAG 的架構與適用場景

RAG（Retrieval-Augmented Generation）是 2023 年後最重要的 LLM 應用架構之一，解決了「語言模型知識有限且靜態」的根本問題。

RAG 的三個核心元件：向量資料庫（儲存並檢索文件）、Embedding 模型（把文字轉成可計算相似度的向量）、生成模型（根據檢索結果生成回答）。這三個元件缺一不可。

RAG 的適用場景特徵：擁有大量私有/專屬文件需要被引用；需要生成有根據的回答（不能幻覺）；資料會持續更新（不適合重新訓練模型）；回答需要引用具體來源。本題的洗錢案例資料庫完全符合這四點。

RAG vs Fine-tuning 的選擇：RAG 適合「資料會更新、需要引用原文、私有資料量大」的場景；Fine-tuning 適合「需要模型學習特定語氣/風格、輸入輸出格式固定、資料量足夠」的場景。本題明顯是 RAG 的適用場景。

為什麼出題者要考這題：RAG 是企業 AI 應用中最常被選用的技術架構，能辨識何時適合用 RAG、它解決什麼問題，是規劃師的核心知識。

05　陷阱

為什麼其他選項是錯的

A使用 Midjourney 生成交易流程圖像

字面在說什麼

用 AI 圖像生成工具，把洗錢交易流程視覺化成圖片。

為什麼不對

Midjourney 是藝術圖像生成工具，不能分析交易數據，也不能生成文字分析報告。題目要的是「可疑交易的特徵描述報告」，這是文字輸出，不是圖像。

誰會選錯

對生成式 AI 工具沒有概念，以為所有 AI 工具都能做所有事的人。

B採用 Few-shot Learning 訓練圖像識別模型

字面在說什麼

用少量案例訓練一個圖像識別模型來偵測洗錢。

為什麼不對

兩個問題：第一，洗錢偵測的主要資料是交易記錄（文字/數字），不是圖像；第二，題目的需求是「生成特徵描述報告」，不是訓練一個分類器。Few-shot Learning 是訓練技術，不能直接生成報告。

誰會選錯

知道 Few-shot Learning 是「小樣本技術」，但混淆了「訓練分類器」和「生成分析報告」兩種不同目的的人。

D直接使用 ChatGPT 的基礎模型進行分析

字面在說什麼

把可疑交易資料直接貼給 ChatGPT，請它分析。

為什麼不對

ChatGPT 基礎模型沒有「永興支付」的歷史洗錢案例資料。它能生成通用的反洗錢分析框架，但無法引用公司的具體案例，也可能產生幻覺，不符合需要根據歷史資料庫生成有憑有據報告的需求。

檢索增強生成（Retrieval-Augmented Generation）讓語言模型在生成前先檢索知識庫相關文件，使報告有真實案例依據，是此題洗錢偵測場景的正解技術
反洗錢人工智慧（Anti-Money Laundering AI）應用 AI 偵測可疑交易模式並自動生成報告的金融合規技術，RAG 可讓此類系統引用歷史案例生成有根據的分析
少樣本學習（Few-shot Learning）用少量標注範例讓模型學習特定任務的技術，是易混淆選項中圖像識別模型的訓練方式，但不適合生成文字報告
向量資料庫（Vector Database）儲存文件 Embedding 向量並支援語意搜尋的資料庫，是 RAG 架構中存放歷史洗錢案例的核心基礎設施
詐欺偵測（Fraud Detection）識別金融交易中異常行為的 AI 技術，與反洗錢偵測高度相關，同樣適合用 RAG 結合歷史案例庫來提升準確率