AFE（自動特徵工程）是什麼？完整定義與解說

機器學習模型訓練

原始資料一堆欄位，模型卻看不出重點，能不能讓系統自己幫你做特徵？ 你可以把自動特徵工程想成資料整理助理，它會把原始欄位變成更好學的訊號。它想減少人工反覆試欄位組合的時間，讓模型更快找到有用規律。

你可以把它想成一個把抽象概念拉回日常判斷的提示，先知道它解決什麼問題，再看技術細節。

容易混淆

自動特徵工程 vs 特徵選擇？ 自動特徵工程：系統自動產生與挑選特徵特徵選擇：從現有特徵裡挑出較好的最關鍵的區別：前者會創造新特徵，後者主要是在挑現有特徵

自動特徵工程 vs 自動化清理？ 自動特徵工程：幫你處理欄位關係自動化清理：幫你修正缺失值與格式最關鍵的區別：清理是把資料整理乾淨，特徵工程是把資料變得更有資訊

自動特徵工程 vs AutoML？ 自動特徵工程：偏向資料前處理 AutoML：涵蓋特徵、模型與調參的整套自動化流程最關鍵的區別：AutoML 是更大一層的流程，自動特徵工程只是其中一段

記住這句就好

把原始欄位變成模型更容易學的訊號

實際案例

信用風險 把收入、負債、交易頻率組合出比單一欄位更有預測力的特徵

流失預測 從登入次數、最近互動時間與購買間隔中，自動找出能預測流失的組合

算法與應用

重點你要看什麼為什麼重要

輸入原始表格資料越乾淨越容易做出好特徵

方法交叉組合、統計聚合、時間窗特徵把局部訊號變成可學訊號

輸出新特徵集合再交給模型訓練或篩選

重點	你要看什麼	為什麼重要
輸入	原始表格資料	越乾淨越容易做出好特徵
方法	交叉組合、統計聚合、時間窗特徵	把局部訊號變成可學訊號
輸出	新特徵集合	再交給模型訓練或篩選

情境判斷

Q1：如果原始欄位很多但彼此關係複雜，這類工具有沒有幫助？ → 有，因為它可以自動嘗試欄位交互作用與聚合特徵

Q2：若資料量很小又很乾淨，還需要大量自動特徵工程嗎？ → 不一定，過度產生特徵反而可能增加噪音與過擬合風險

常見問題

自動特徵工程會取代資料科學家嗎？

不會。它省時間，但仍需要人決定問題定義、資料品質與結果是否合理。

做得越多特徵一定越好嗎？

不是。特徵太多可能讓模型更難訓練，也更容易過擬合。

它和特徵選擇哪個先做？

通常先確認資料乾淨，再做特徵產生與選擇，實務流程可交錯進行。

容易混淆

記住這句就好

實際案例

算法與應用

情境判斷

常見問題

相關術語

延伸學習

資料來源與參考依據