特徵擷取 是什麼?

Feature Extraction — 特徵擷取 的完整解釋

特徵擷取是從原始資料中自動識別並提取有意義的特徵表示的過程,目的是降低資料維度同時保留關鍵資訊,提升模型學習效率

容易混淆

特徵擷取 vs 特徵工程 特徵工程偏向人手設計,重點是領域知識。 特徵擷取偏向自動化表示學習,重點是把原始資料壓成有效向量。

特徵擷取 vs 降維 降維是把維度變少。 特徵擷取不只想變少,還要保留對任務有用的資訊。

記住這句就好

把原始資料變成好用表示,就是特徵擷取。

實際案例

圖片分類 圖片先經過卷積網路,抽出邊緣、紋理、形狀等表示,再交給分類器判斷內容。

文字分析 一段評論先轉成詞向量或句向量,模型不用逐字讀完整篇原文,也能抓到語意重點。

算法與應用

常見做法包括卷積網路的中間層輸出、詞向量、句向量與自編碼器表徵。 它常用在影像、語音、文本和感測資料,目標都是把高維原始資料轉成可學習的特徵表示。

特徵擷取 在 iPAS 考試中的重點

根據歷年統計,特徵擷取 相關題目 屬於中頻考範圍。

常見問題

特徵擷取一定要靠深度學習嗎?

不一定,傳統方法也可以做,但深度學習常能學到更強的表示。

特徵擷取會不會把資訊丟太多?

會,所以要看任務需要,抽得太狠可能讓關鍵差異消失。

特徵擷取和分類器哪個比較重要?

兩者都重要,表示做得好,分類器才有材料可用。

這個詞和嵌入是一樣的嗎?

不是完全一樣,嵌入常是特徵表示的一種形式,但特徵擷取涵蓋更廣。

資料來源

← 回到 特徵擷取 快查頁

測驗你對 特徵擷取 的理解

透過模擬考系統檢驗學習成果

開始測驗