特徵擷取 是什麼?
Feature Extraction — 特徵擷取 的完整解釋
特徵擷取是從原始資料中自動識別並提取有意義的特徵表示的過程,目的是降低資料維度同時保留關鍵資訊,提升模型學習效率
容易混淆
特徵擷取 vs 特徵工程 特徵工程偏向人手設計,重點是領域知識。 特徵擷取偏向自動化表示學習,重點是把原始資料壓成有效向量。
特徵擷取 vs 降維 降維是把維度變少。 特徵擷取不只想變少,還要保留對任務有用的資訊。
記住這句就好
把原始資料變成好用表示,就是特徵擷取。
實際案例
圖片分類 圖片先經過卷積網路,抽出邊緣、紋理、形狀等表示,再交給分類器判斷內容。
文字分析 一段評論先轉成詞向量或句向量,模型不用逐字讀完整篇原文,也能抓到語意重點。
算法與應用
常見做法包括卷積網路的中間層輸出、詞向量、句向量與自編碼器表徵。 它常用在影像、語音、文本和感測資料,目標都是把高維原始資料轉成可學習的特徵表示。
特徵擷取 在 iPAS 考試中的重點
根據歷年統計,特徵擷取 相關題目 屬於中頻考範圍。
常見問題
特徵擷取一定要靠深度學習嗎?
不一定,傳統方法也可以做,但深度學習常能學到更強的表示。
特徵擷取會不會把資訊丟太多?
會,所以要看任務需要,抽得太狠可能讓關鍵差異消失。
特徵擷取和分類器哪個比較重要?
兩者都重要,表示做得好,分類器才有材料可用。
這個詞和嵌入是一樣的嗎?
不是完全一樣,嵌入常是特徵表示的一種形式,但特徵擷取涵蓋更廣。
資料來源
- iPAS AI 應用規劃師評鑑內容範圍參考(115.02) — 經濟部產業人才能力鑑定