特徵選擇法 是什麼?
Feature Selection — 特徵選擇法 的完整解釋
特徵選擇是機器學習中選擇最相關特徵子集的過程,旨在簡化模型、提高準確性、減少過擬合和提升模型的可解釋性。
容易混淆
特徵選擇法 vs 特徵工程 特徵工程是把新特徵做出來。 特徵選擇法是從現有特徵裡挑出最值得保留的。
特徵選擇法 vs 降維處理 特徵選擇留下的是原本欄位。 降維處理會把欄位轉成新的低維表示。
記住這句就好
不一定要更多特徵,常常是更少但更準。
實際案例
醫療預測 病歷欄位很多,但真正和疾病相關的可能只有幾個,選對欄位能讓模型更容易解釋。
廣告點擊 很多行為欄位彼此重複,先選出最有訊號的特徵,訓練通常更快也更穩。
算法與應用
常見方法有過濾式、包裹式和嵌入式,分別對應快速篩選、模型迭代評估與內建選擇。 線性模型常搭配 L1 正則化,樹模型也常用特徵重要度做篩選。
相關術語
常見問題
特徵少就一定比較好嗎?
不一定,重點是保留足夠資訊,不是無腦砍欄位。
特徵選擇會不會把重要資訊刪掉?
會有這個風險,所以要配合驗證集和領域知識。
特徵選擇一定要看模型結果嗎?
最好要,不然你只是在猜哪些欄位有用。
和主成分分析哪個更直觀?
特徵選擇比較直觀,因為留下來的還是原始欄位。