iPAS AI 應用規劃師 中級 科目三 機器學習技術與應用

信用評分卡標準流程不包含哪一項?

原題 25

某金融機構正在建立傳統信用評分卡模型,採用邏輯迴歸(Logistic Regression)作為建模方法,並依循監理機關建議的標準化流程進行模型開發。下列哪一項不是傳統信用評分卡模型開發流程中的常見步驟?

白話

一家金融機構要建立傳統信用評分卡模型,用的是邏輯迴歸,而且要按照監理機關建議的標準流程來開發。

問你:下列四個步驟,哪一項「不是」傳統信用評分卡模型開發流程中的常見步驟?

點選你的答案。

01 總結

一句話總結

傳統信用評分卡的標準流程「不包含」的是:使用生成式模型進行特徵學習——信用評分卡必須可解釋、符合監理要求,生成式模型是現代深度學習技術,與傳統邏輯迴歸評分卡的設計理念完全不符。

02 情境

先感受問題:銀行怎麼決定你能不能貸款?

你是第一銀行消費金融部的信用風控師。你要建立一個信用評分卡,決定申請信用卡的客戶要核卡、拒卡、還是核卡但降低額度。

這個模型有個特殊要求:金管會要求你的模型「可解釋」——如果拒絕了某位客戶,必須能說出「因為您的負債比率超過 60%,所以被扣了 XX 分」。這意味著你不能用無法解釋的黑箱模型。

傳統信用評分卡的標準做法因此高度結構化:用特定的分箱技術、特定的特徵篩選方法,最後用邏輯迴歸建模,整個過程都是為了「可解釋、可審計、符合監理要求」而設計的。

03 對照

傳統信用評分卡的標準流程有哪些步驟

  1. 資料準備與壞帳定義:定義「好客戶」(如 12 個月內無逾期)和「壞客戶」(如逾期 90 天以上),這是評分卡的學習目標。
  2. 分箱(Binning)與 WOE 轉換:把連續變數(如年齡、收入)切分成區間,計算每個區間的 Weight of Evidence(WOE),讓邏輯迴歸能處理非線性關係同時保持可解釋性。
  3. 資訊值(IV)計算與特徵篩選:用 IV 評估每個特徵對預測壞帳的區分能力,IV < 0.02 通常不用,IV > 0.5 可能有資料洩漏問題。
  4. 多重共線性分析:用 VIF(方差膨脹因子)確認特徵之間沒有高度相關,避免邏輯迴歸係數不穩定。
  5. PSI 監控:模型上線後,定期計算申請樣本的 PSI,確認申請人群體的分佈沒有顯著偏移,若 PSI > 0.2 代表模型需要重新訓練。
04 解法

為什麼生成式模型不屬於這個流程

生成式模型(Generative Model)是指能學習資料分佈並生成新樣本的模型,例如 GAN(生成對抗網路)、VAE(變分自編碼器),或現代的大型語言模型。

傳統信用評分卡不採用生成式模型,有三個根本原因:

  • 可解釋性要求:金管會和 Basel 協定要求信用模型必須可解釋。生成式模型是黑箱,無法說明「為什麼這個特徵對信用決策有貢獻」。
  • 設計目標不符:生成式模型的目標是「生成新資料」或「學習資料分佈」,不是「區分好壞客戶」。信用評分卡需要的是判別式模型(Discriminative Model),直接學習 P(壞帳|特徵)。
  • 監理合規要求:監理機關建議的標準化流程明確要求使用可審計的統計方法(邏輯迴歸),生成式模型完全不在標準流程中。

這就是為什麼選項 A 不是傳統信用評分卡的常見步驟:使用生成式模型進行特徵學習——與傳統評分卡的可解釋性要求和監理框架完全不符。

技術版:傳統信用評分卡的方法論背景

傳統信用評分卡(Credit Scorecard)屬於監督式學習金融風控的交叉領域,是金融業歷史最悠久的機器學習應用之一。

在 AI 領域的位置:信用評分卡是一個特殊化的二元分類問題,但由於監理合規要求,必須使用可解釋的統計模型(邏輯迴歸為主)。它的方法論在 1950-1970 年代已成熟,至今仍是金融業信用決策的主流工具。

核心工具組:

  • WOE(Weight of Evidence):量化每個分箱對好/壞帳的區分能力,用 ln(好帳率/壞帳率) 計算。
  • IV(Information Value):所有分箱的 WOE 加權求和,衡量整個特徵的預測能力。
  • PSI(Population Stability Index):比較訓練集與當前申請樣本的分佈差異,PSI < 0.1 穩定,0.1-0.2 需注意,> 0.2 需重訓。

為什麼出題者要考這題:信用評分卡是金融科技的核心應用,考的是應試者是否了解「傳統可解釋模型 vs. 現代黑箱模型」的適用邊界。在金融監理環境下,不是所有先進技術都能直接應用。

05 陷阱

為什麼其他選項確實屬於標準流程(都不是答案)

B進行特徵選擇與多重共線性(Multicollinearity)分析

字面在說什麼

用 IV 等指標篩選特徵,並用 VIF 等工具確認特徵之間沒有高度相關。

為什麼不對(為何它確實是標準步驟)

這確實是傳統評分卡的核心步驟。多重共線性會讓邏輯迴歸的係數不穩定(兩個高度相關的特徵會互相「搶走」解釋權重),所以必須在建模前檢查並處理。這是任何邏輯迴歸評分卡開發都必不可少的環節。

誰會選錯

不了解評分卡流程,以為「多重共線性分析是進階才做的選項」的人。在傳統評分卡中,這是基本步驟,不做就可能出現係數方向錯誤(明明負債越高信用越差,模型卻給正係數)。

C進行分箱(Binning)與資訊值(Information Value, IV)檢定

字面在說什麼

把連續變數切成區間,計算每個變數的 IV 值,評估其對目標的預測能力。

為什麼不對(為何它確實是標準步驟)

分箱 + WOE + IV 是傳統評分卡最具特色的方法論,幾乎所有評分卡教科書和監理指引都明確要求這個步驟。它讓邏輯迴歸能捕捉非線性關係,同時保持分段可解釋性(「年收入在 60-100 萬的客戶,這個分箱的評分是 XX 分」)。

誰會選錯

聽過 IV 但不確定它是不是「傳統」方法的人。IV 和 WOE 是評分卡的標誌性工具,是傳統方法的核心而非例外。

D使用樣本穩定性指標(Population Stability Index, PSI)檢驗模型穩定性

字面在說什麼

PSI 比較訓練樣本與當前申請樣本的分佈,監控模型是否還適用於現在的客戶群體。

為什麼不對(為何它確實是標準步驟)

PSI 是信用評分卡模型監控的標準指標,屬於「模型部署後維護」的必要步驟。監理機關要求金融機構定期(至少每季)計算 PSI 並報告。PSI > 0.2 時,模型需要重新驗證或重訓,這是監理合規的基本要求。

誰會選錯

不熟悉信用評分卡部署後流程的人,以為評分卡只有「建模」沒有「監控」。傳統評分卡非常重視模型生命週期管理,PSI 是最重要的監控工具之一。

06 變形

同個考點下次怎麼變形

變形 1

IV 值的判斷標準是什麼?IV > 0.5 代表特徵很好嗎?

直覺

IV 越高代表特徵預測力越強,所以 IV > 0.5 應該是很好的特徵?

答案

IV 的一般標準:< 0.02 幾乎無用;0.02-0.1 弱;0.1-0.3 中等;0.3-0.5 強;> 0.5 可疑——因為現實中幾乎沒有特徵能完美區分好壞客戶,IV 過高可能代表資料洩漏(用了包含未來資訊的特徵),需要特別檢查。

變形 2

WOE 轉換有什麼好處?

直覺

分箱後為什麼要再做 WOE 轉換,而不是直接用分箱編號?

答案

WOE 的好處:(1)讓邏輯迴歸捕捉非線性關係(不同分箱有不同的 WOE 值);(2)讓各特徵在同一個尺度上比較(都是 ln 尺度);(3)自動處理缺失值(缺失值作為單獨分箱);(4)提升模型可解釋性(每個分箱的 WOE 值直接反映其對好/壞帳的方向)。

變形 3

PSI 超過 0.2 時,一定要重新訓練模型嗎?

直覺

PSI > 0.2 代表「人口分佈已顯著偏移」,但一定要重訓嗎?

答案

不一定立即重訓,但必須進行模型重新驗證(Model Revalidation):檢查模型在新樣本上的 Gini/KS/AUC 是否顯著下降。如果鑑別力仍符合標準,可以不重訓但必須報告給風控委員會;如果鑑別力也下降,才需要重新建模。PSI > 0.2 是「警示燈亮起」,不是「自動觸發重訓」。

變形 4

現代機器學習(隨機森林、XGBoost)能取代信用評分卡嗎?

直覺

XGBoost 的 AUC 通常比邏輯迴歸評分卡高,為什麼銀行還在用傳統評分卡?

答案

在台灣、美國等有嚴格監理的市場,使用黑箱模型做信用決策面臨兩個障礙:(1)《公平信用報告法》等法規要求能說明拒貸原因;(2)監理機關的模型審查要求書面可解釋。目前的解決方向是「可解釋機器學習」(如 SHAP 解釋 XGBoost 特徵貢獻),但完全取代評分卡在短期內不現實。部分銀行採用「評分卡 + XGBoost 雙模型」架構:評分卡用於合規申報,XGBoost 用於輔助決策。

變形 5

Gini 係數和 KS 統計量在信用評分中是什麼意義?

直覺

評分卡最常用的鑑別力指標不是 AUC,而是 Gini 和 KS?

答案

Gini = 2 × AUC - 1(直接換算),衡量模型區分好壞帳的整體能力;通常 Gini > 0.4 才算可用,> 0.6 優秀。KS(Kolmogorov-Smirnov 統計量)找出好帳累積分佈和壞帳累積分佈差距最大的評分切點,表示在那個分數點模型的鑑別能力最強;KS > 0.3 通常可接受。兩個指標從不同角度衡量鑑別力,金融業通常同時報告。

07 延伸

想再往下看,這 5 個

出處

iPAS 經濟部產業人才能力鑑定 ・ 114 年第二梯次 iPAS AI 應用規劃師 中級 科目三 機器學習技術與應用 第 25 題

查看官方原文 PDF