特徵工程 是什麼?
Feature Engineering — 特徵工程 的完整解釋
特徵工程透過創建、轉換與選擇原始資料的代表性特徵,顯著提升機器學習模型的預測效果
容易混淆
特徵工程 vs 特徵擷取 特徵工程偏向人為設計和轉換,像把生日變成年齡。 特徵擷取偏向從原始資料自動抽出表示,像把圖片轉成向量特徵。
特徵工程 vs 模型訓練 特徵工程是在準備輸入。 模型訓練是在學怎麼用這些輸入做預測,兩者前後順序不同。
記住這句就好
特徵做得好,模型才有材料可學。
實際案例
信用評分 把收入、負債比、繳款紀錄整理成更有判斷力的欄位,模型才比較能分出風險。
電商推薦 把最近點擊、瀏覽次數、品類偏好整理成特徵,推薦結果通常會比只看原始交易表更準。
算法與應用
常見做法包含數值轉換、類別編碼、時間特徵、交互特徵和缺值處理。 在傳統機器學習裡,它常直接影響模型上限,在深度學習裡,仍會影響輸入品質與訓練穩定度。
特徵工程 在 iPAS 考試中的重點
根據歷年統計,特徵工程 相關題目 平均佔 AI 技術類考題 7%, 屬於高頻考範圍。
常見出題方向:特徵工程的步驟與方法(45%)、資料前處理技術辨別(35%)、特徵選取與轉換方法(20%)。
相關術語
常見問題
特徵工程一定要很會寫程式嗎?
不一定,懂資料和業務脈絡常比會不會套工具更重要。
特徵工程和資料清理是一樣的嗎?
不一樣,資料清理是修錯資料,特徵工程是把資料變得更能幫模型判斷。
特徵工程會不會過度依賴經驗?
會有這個風險,所以通常要搭配驗證集和交叉驗證檢查效果。
自動化特徵工程有沒有用?
有,但它適合先擴充候選方向,最後仍常需要人工判斷哪些特徵真的合理。
資料來源
- iPAS AI 應用規劃師評鑑內容範圍參考(115.02) — 經濟部產業人才能力鑑定