語音辨識 是什麼?

Speech Recognition — 語音辨識 的完整解釋

語音辨識是一種將人類語音轉換為機器可理解的文字或指令的技術,使電腦能夠聽懂並處理人類語言。

容易混淆

語音合成 語音辨識是「聽」的技術,把聲音變成文字。 語音合成是「說」的技術,把文字變成聲音。一個是把人的話讓機器懂,另一個是讓機器能用人的方式說話。

最關鍵的區別:先看它是在比意思、比結構,還是在做任務輸出。

記住這句就好

把聲音變文字,就是語音辨識。

實際案例

手機語音輸入把你的口述轉成訊息內容。 會議錄音轉文字,方便後續搜尋和摘要。

算法與應用

核心元件常包含聲學模型、語言模型和解碼器,現在也常用端到端深度學習架構。 評估常看詞錯誤率,因為一個字辨錯就可能影響整句意思。

情境判斷

Q1(直覺題): 你按住麥克風對手機說話,這就是語音辨識的典型應用嗎?

→ 是。把聲音轉成文字或指令,正是它的主場。

Q2(判斷題): 如果環境很吵、講話又重疊,準確率通常會怎樣?

→ 會下降。看情況,噪音和重疊語音都會讓辨識變難。

語音辨識 在 iPAS 考試中的重點

根據歷年統計,語音辨識 相關題目 平均佔 AI 技術類考題 5%, 屬於中頻考範圍。

常見出題方向:應用場景識別與分析(45%)、技術整合方案設計(35%)、實務應用案例判斷(20%)。

相關術語

常見問題

什麼是語音辨識?

語音辨識是一種將人類語音轉換為機器可理解的文字或指令的技術,使電腦能夠聽懂並處理人類語言。它結合了聲學模型和語言模型,在人機交互中扮演重要角色。

語音辨識在 iPAS 考試中怎麼考?

iPAS 初級考試(L11402)中,語音辨識的考點包括基本概念、核心技術(聲學模型、語言模型)、評估指標(詞錯誤率)和實際應用。常見題型有選擇題、簡答題和案例分析。

語音辨識和哪個術語最常被混淆?

語音辨識最常與語音合成混淆。語音辨識是將語音轉換為文字,而語音合成則是將文字轉換為語音。兩者功能相反,但都是語音處理的重要組成部分,應用於不同場景。

資料來源

← 回到 語音辨識 快查頁

測驗你對 語音辨識 的理解

透過模擬考系統檢驗學習成果

開始測驗