特徵工程 是什麼?

Feature Engineering — 特徵工程 的完整解釋

特徵工程透過創建、轉換與選擇原始資料的代表性特徵,顯著提升機器學習模型的預測效果

容易混淆

特徵工程 vs 特徵擷取 特徵工程偏向人為設計和轉換,像把生日變成年齡。 特徵擷取偏向從原始資料自動抽出表示,像把圖片轉成向量特徵。

特徵工程 vs 模型訓練 特徵工程是在準備輸入。 模型訓練是在學怎麼用這些輸入做預測,兩者前後順序不同。

記住這句就好

特徵做得好,模型才有材料可學。

實際案例

信用評分 把收入、負債比、繳款紀錄整理成更有判斷力的欄位,模型才比較能分出風險。

電商推薦 把最近點擊、瀏覽次數、品類偏好整理成特徵,推薦結果通常會比只看原始交易表更準。

算法與應用

常見做法包含數值轉換、類別編碼、時間特徵、交互特徵和缺值處理。 在傳統機器學習裡,它常直接影響模型上限,在深度學習裡,仍會影響輸入品質與訓練穩定度。

特徵工程 在 iPAS 考試中的重點

根據歷年統計,特徵工程 相關題目 平均佔 AI 技術類考題 7%, 屬於高頻考範圍。

常見出題方向:特徵工程的步驟與方法(45%)、資料前處理技術辨別(35%)、特徵選取與轉換方法(20%)。

相關術語

常見問題

特徵工程一定要很會寫程式嗎?

不一定,懂資料和業務脈絡常比會不會套工具更重要。

特徵工程和資料清理是一樣的嗎?

不一樣,資料清理是修錯資料,特徵工程是把資料變得更能幫模型判斷。

特徵工程會不會過度依賴經驗?

會有這個風險,所以通常要搭配驗證集和交叉驗證檢查效果。

自動化特徵工程有沒有用?

有,但它適合先擴充候選方向,最後仍常需要人工判斷哪些特徵真的合理。

資料來源

← 回到 特徵工程 快查頁

測驗你對 特徵工程 的理解

透過模擬考系統檢驗學習成果

開始測驗