編碼器 是什麼?
Encoder — 編碼器 的完整解釋
編碼器將輸入資料轉換為固定長度的向量表示,提取其語義特徵,以供解碼器或下游任務使用。
容易混淆
編碼器 vs 解碼器 編碼器負責把輸入整理成表徵,解碼器負責把表徵轉成輸出,像翻譯、摘要或回覆。
編碼器 vs 嵌入表示 嵌入表示是向量結果,編碼器是產生這些向量的模型或模組。
編碼器 vs 轉換器架構 編碼器是組件,轉換器架構是整個系統設計,兩者不是同一層級。
最關鍵的區別: 編碼器是在做「理解和壓縮」,不是在做「輸出生成」。
記住這句就好
先把輸入讀懂,再變成好用的表示。
實際案例
案例一:客服工單分類 使用者留言很長,編碼器先把整段話濃縮成語意向量,再交給分類器判斷是退貨、報修還是抱怨。
案例二:語意搜尋 你輸入「台北捷運到機場多久」,編碼器把查詢轉成向量,和文件庫裡的文章向量比對,找出最相關的答案。
算法與應用
編碼器的核心工作是特徵抽取,常見做法包括 RNN 編碼、CNN 編碼和 Transformer 編碼。BERT 這類雙向編碼器會同時看左右文,適合分類、抽取和檢索。當輸入很長時,編碼器通常要配合池化、注意力或分段處理,才能保留關鍵資訊。
情境判斷
Q1(直覺題): 你要把一段文章轉成向量,拿去做分類,這時候比較需要編碼器還是解碼器?
→ 比較需要編碼器,因為分類任務重點是先把輸入變成有意義的表示,而不是生成新文字。
Q2(判斷題): 如果同一段輸入在不同上下文下意思會變,單純固定詞向量夠不夠?
→ 不夠,這時候要用能看上下文的編碼器,像 Transformer 或 BERT 類模型,因為同一個詞在不同句子裡的語意可能不一樣。
編碼器 在 iPAS 考試中的重點
根據歷年統計,編碼器 相關題目 平均佔 AI 技術類考題 3%, 屬於未分類考範圍。
常見出題方向:類神經網路模型架構(40%)、資料壓縮與特徵學習(35%)、序列到序列模型原理(25%)。
相關術語
常見問題
編碼器和詞嵌入(Word Embedding)有什麼不同?
詞嵌入是詞的向量表示,編碼器是把整段輸入變成表示的模型。詞嵌入可以是編碼器的一部分,但兩者不是同一件事。
什麼時候應該使用編碼器?
當你的任務重點是理解、分類、檢索、抽取或壓縮輸入資訊時,就很常用到編碼器。
初學者學習編碼器最常見的誤解是什麼?
很多人以為編碼器只是把文字變短,實際上它更重要的工作是保留語意重點,讓後續模型能更有效利用資訊。
資料來源
- iPAS AI 應用規劃師評鑑內容範圍參考(115.02) — 經濟部產業人才能力鑑定