iPAS AI 應用規劃師中級　科目三　機器學習技術與應用

信用評分卡標準流程不包含哪一項？

原題 25

某金融機構正在建立傳統信用評分卡模型，採用邏輯迴歸（Logistic Regression）作為建模方法，並依循監理機關建議的標準化流程進行模型開發。下列哪一項不是傳統信用評分卡模型開發流程中的常見步驟？

白話

一家金融機構要建立傳統信用評分卡模型，用的是邏輯迴歸，而且要按照監理機關建議的標準流程來開發。

問你：下列四個步驟，哪一項「不是」傳統信用評分卡模型開發流程中的常見步驟？

點選你的答案。

← 回 50 題列表回 iPAS 備考總覽

01　總結

一句話總結

傳統信用評分卡的標準流程「不包含」的是：使用生成式模型進行特徵學習——信用評分卡必須可解釋、符合監理要求，生成式模型是現代深度學習技術，與傳統邏輯迴歸評分卡的設計理念完全不符。

02　情境

先感受問題：銀行怎麼決定你能不能貸款？

你是第一銀行消費金融部的信用風控師。你要建立一個信用評分卡，決定申請信用卡的客戶要核卡、拒卡、還是核卡但降低額度。

這個模型有個特殊要求：金管會要求你的模型「可解釋」——如果拒絕了某位客戶，必須能說出「因為您的負債比率超過 60%，所以被扣了 XX 分」。這意味著你不能用無法解釋的黑箱模型。

傳統信用評分卡的標準做法因此高度結構化：用特定的分箱技術、特定的特徵篩選方法，最後用邏輯迴歸建模，整個過程都是為了「可解釋、可審計、符合監理要求」而設計的。

03　對照

傳統信用評分卡的標準流程有哪些步驟

資料準備與壞帳定義：定義「好客戶」（如 12 個月內無逾期）和「壞客戶」（如逾期 90 天以上），這是評分卡的學習目標。
分箱（Binning）與 WOE 轉換：把連續變數（如年齡、收入）切分成區間，計算每個區間的 Weight of Evidence（WOE），讓邏輯迴歸能處理非線性關係同時保持可解釋性。
資訊值（IV）計算與特徵篩選：用 IV 評估每個特徵對預測壞帳的區分能力，IV < 0.02 通常不用，IV > 0.5 可能有資料洩漏問題。
多重共線性分析：用 VIF（方差膨脹因子）確認特徵之間沒有高度相關，避免邏輯迴歸係數不穩定。
PSI 監控：模型上線後，定期計算申請樣本的 PSI，確認申請人群體的分佈沒有顯著偏移，若 PSI > 0.2 代表模型需要重新訓練。

04　解法

為什麼生成式模型不屬於這個流程

生成式模型（Generative Model）是指能學習資料分佈並生成新樣本的模型，例如 GAN（生成對抗網路）、VAE（變分自編碼器），或現代的大型語言模型。

傳統信用評分卡不採用生成式模型，有三個根本原因：

可解釋性要求：金管會和 Basel 協定要求信用模型必須可解釋。生成式模型是黑箱，無法說明「為什麼這個特徵對信用決策有貢獻」。
設計目標不符：生成式模型的目標是「生成新資料」或「學習資料分佈」，不是「區分好壞客戶」。信用評分卡需要的是判別式模型（Discriminative Model），直接學習 P(壞帳|特徵)。
監理合規要求：監理機關建議的標準化流程明確要求使用可審計的統計方法（邏輯迴歸），生成式模型完全不在標準流程中。

這就是為什麼選項 A 不是傳統信用評分卡的常見步驟：使用生成式模型進行特徵學習——與傳統評分卡的可解釋性要求和監理框架完全不符。

技術版：傳統信用評分卡的方法論背景

傳統信用評分卡（Credit Scorecard）屬於監督式學習與金融風控的交叉領域，是金融業歷史最悠久的機器學習應用之一。

在 AI 領域的位置：信用評分卡是一個特殊化的二元分類問題，但由於監理合規要求，必須使用可解釋的統計模型（邏輯迴歸為主）。它的方法論在 1950-1970 年代已成熟，至今仍是金融業信用決策的主流工具。

核心工具組：

WOE（Weight of Evidence）：量化每個分箱對好/壞帳的區分能力，用 ln(好帳率/壞帳率) 計算。
IV（Information Value）：所有分箱的 WOE 加權求和，衡量整個特徵的預測能力。
PSI（Population Stability Index）：比較訓練集與當前申請樣本的分佈差異，PSI < 0.1 穩定，0.1-0.2 需注意，> 0.2 需重訓。

為什麼出題者要考這題：信用評分卡是金融科技的核心應用，考的是應試者是否了解「傳統可解釋模型 vs. 現代黑箱模型」的適用邊界。在金融監理環境下，不是所有先進技術都能直接應用。

05　陷阱

為什麼其他選項確實屬於標準流程（都不是答案）

B進行特徵選擇與多重共線性（Multicollinearity）分析

字面在說什麼

用 IV 等指標篩選特徵，並用 VIF 等工具確認特徵之間沒有高度相關。

為什麼不對（為何它確實是標準步驟）

這確實是傳統評分卡的核心步驟。多重共線性會讓邏輯迴歸的係數不穩定（兩個高度相關的特徵會互相「搶走」解釋權重），所以必須在建模前檢查並處理。這是任何邏輯迴歸評分卡開發都必不可少的環節。

誰會選錯

不了解評分卡流程，以為「多重共線性分析是進階才做的選項」的人。在傳統評分卡中，這是基本步驟，不做就可能出現係數方向錯誤（明明負債越高信用越差，模型卻給正係數）。

C進行分箱（Binning）與資訊值（Information Value, IV）檢定

字面在說什麼

把連續變數切成區間，計算每個變數的 IV 值，評估其對目標的預測能力。

為什麼不對（為何它確實是標準步驟）

分箱 + WOE + IV 是傳統評分卡最具特色的方法論，幾乎所有評分卡教科書和監理指引都明確要求這個步驟。它讓邏輯迴歸能捕捉非線性關係，同時保持分段可解釋性（「年收入在 60-100 萬的客戶，這個分箱的評分是 XX 分」）。

誰會選錯

聽過 IV 但不確定它是不是「傳統」方法的人。IV 和 WOE 是評分卡的標誌性工具，是傳統方法的核心而非例外。

D使用樣本穩定性指標（Population Stability Index, PSI）檢驗模型穩定性

字面在說什麼

PSI 比較訓練樣本與當前申請樣本的分佈，監控模型是否還適用於現在的客戶群體。

為什麼不對（為何它確實是標準步驟）

PSI 是信用評分卡模型監控的標準指標，屬於「模型部署後維護」的必要步驟。監理機關要求金融機構定期（至少每季）計算 PSI 並報告。PSI > 0.2 時，模型需要重新驗證或重訓，這是監理合規的基本要求。

誰會選錯

不熟悉信用評分卡部署後流程的人，以為評分卡只有「建模」沒有「監控」。傳統評分卡非常重視模型生命週期管理，PSI 是最重要的監控工具之一。

06　變形

同個考點下次怎麼變形

變形 1

IV 值的判斷標準是什麼？IV > 0.5 代表特徵很好嗎？

直覺

IV 越高代表特徵預測力越強，所以 IV > 0.5 應該是很好的特徵？

答案

IV 的一般標準：< 0.02 幾乎無用；0.02-0.1 弱；0.1-0.3 中等；0.3-0.5 強；> 0.5 可疑——因為現實中幾乎沒有特徵能完美區分好壞客戶，IV 過高可能代表資料洩漏（用了包含未來資訊的特徵），需要特別檢查。

變形 2

WOE 轉換有什麼好處？

直覺

分箱後為什麼要再做 WOE 轉換，而不是直接用分箱編號？

答案

WOE 的好處：（1）讓邏輯迴歸捕捉非線性關係（不同分箱有不同的 WOE 值）；（2）讓各特徵在同一個尺度上比較（都是 ln 尺度）；（3）自動處理缺失值（缺失值作為單獨分箱）；（4）提升模型可解釋性（每個分箱的 WOE 值直接反映其對好/壞帳的方向）。

變形 3

PSI 超過 0.2 時，一定要重新訓練模型嗎？

直覺

PSI > 0.2 代表「人口分佈已顯著偏移」，但一定要重訓嗎？

答案

不一定立即重訓，但必須進行模型重新驗證（Model Revalidation）：檢查模型在新樣本上的 Gini/KS/AUC 是否顯著下降。如果鑑別力仍符合標準，可以不重訓但必須報告給風控委員會；如果鑑別力也下降，才需要重新建模。PSI > 0.2 是「警示燈亮起」，不是「自動觸發重訓」。

變形 4

現代機器學習（隨機森林、XGBoost）能取代信用評分卡嗎？

直覺

XGBoost 的 AUC 通常比邏輯迴歸評分卡高，為什麼銀行還在用傳統評分卡？

答案

在台灣、美國等有嚴格監理的市場，使用黑箱模型做信用決策面臨兩個障礙：（1）《公平信用報告法》等法規要求能說明拒貸原因；（2）監理機關的模型審查要求書面可解釋。目前的解決方向是「可解釋機器學習」（如 SHAP 解釋 XGBoost 特徵貢獻），但完全取代評分卡在短期內不現實。部分銀行採用「評分卡 + XGBoost 雙模型」架構：評分卡用於合規申報，XGBoost 用於輔助決策。

變形 5

Gini 係數和 KS 統計量在信用評分中是什麼意義？

直覺

評分卡最常用的鑑別力指標不是 AUC，而是 Gini 和 KS？

答案

Gini = 2 × AUC - 1（直接換算），衡量模型區分好壞帳的整體能力；通常 Gini > 0.4 才算可用，> 0.6 優秀。KS（Kolmogorov-Smirnov 統計量）找出好帳累積分佈和壞帳累積分佈差距最大的評分切點，表示在那個分數點模型的鑑別能力最強；KS > 0.3 通常可接受。兩個指標從不同角度衡量鑑別力，金融業通常同時報告。

07　延伸

想再往下看，這 5 個

邏輯迴歸（Logistic Regression）傳統信用評分卡的核心建模方法，可解釋、可審計，是監理機關認可的標準工具。
信用評分（Credit Scoring）本題情境，將機器學習應用於金融信用決策的最成熟場景之一。
特徵選擇法（Feature Selection）評分卡開發的關鍵步驟，用 IV 等指標篩選真正有預測力的變數。
正則化（Regularization）邏輯迴歸搭配 L1/L2 正則化可進一步控制特徵數量和過擬合風險。
L1 正則化（Lasso）L1 正則化讓部分特徵係數歸零，實現自動特徵選擇，在評分卡特徵篩選中有輔助作用。