語音辨識 是什麼?
Speech Recognition — 語音辨識 的完整解釋
語音辨識是一種將人類語音轉換為機器可理解的文字或指令的技術,使電腦能夠聽懂並處理人類語言。
容易混淆
語音合成 語音辨識是「聽」的技術,把聲音變成文字。 語音合成是「說」的技術,把文字變成聲音。一個是把人的話讓機器懂,另一個是讓機器能用人的方式說話。
最關鍵的區別:先看它是在比意思、比結構,還是在做任務輸出。
記住這句就好
把聲音變文字,就是語音辨識。
實際案例
手機語音輸入把你的口述轉成訊息內容。 會議錄音轉文字,方便後續搜尋和摘要。
算法與應用
核心元件常包含聲學模型、語言模型和解碼器,現在也常用端到端深度學習架構。 評估常看詞錯誤率,因為一個字辨錯就可能影響整句意思。
情境判斷
Q1(直覺題): 你按住麥克風對手機說話,這就是語音辨識的典型應用嗎?
→ 是。把聲音轉成文字或指令,正是它的主場。
Q2(判斷題): 如果環境很吵、講話又重疊,準確率通常會怎樣?
→ 會下降。看情況,噪音和重疊語音都會讓辨識變難。
語音辨識 在 iPAS 考試中的重點
根據歷年統計,語音辨識 相關題目 平均佔 AI 技術類考題 5%, 屬於中頻考範圍。
常見出題方向:應用場景識別與分析(45%)、技術整合方案設計(35%)、實務應用案例判斷(20%)。
相關術語
常見問題
什麼是語音辨識?
語音辨識是一種將人類語音轉換為機器可理解的文字或指令的技術,使電腦能夠聽懂並處理人類語言。它結合了聲學模型和語言模型,在人機交互中扮演重要角色。
語音辨識在 iPAS 考試中怎麼考?
iPAS 初級考試(L11402)中,語音辨識的考點包括基本概念、核心技術(聲學模型、語言模型)、評估指標(詞錯誤率)和實際應用。常見題型有選擇題、簡答題和案例分析。
語音辨識和哪個術語最常被混淆?
語音辨識最常與語音合成混淆。語音辨識是將語音轉換為文字,而語音合成則是將文字轉換為語音。兩者功能相反,但都是語音處理的重要組成部分,應用於不同場景。
資料來源
- iPAS AI 應用規劃師評鑑內容範圍參考(115.02) — 經濟部產業人才能力鑑定