你有沒有想過,電腦怎麼從人話裡抓出意思? 你可以把它想成讓機器學會讀、寫、切詞、分類、抽資訊,像在處理一整套語言工作。 自然語言處理是把文字變成可計算資料的總稱,從分詞到理解,再到生成都屬於它。 這也讓它很適合先拿到可用答案,再慢慢把精度往上推。
容易混淆
自然語言處理 vs 自然語言理解 自然語言處理:整個大領域 自然語言理解:偏理解語意的子領域 最關鍵的區別:先看它是在比什麼,再看它怎麼做。
自然語言處理 vs 語音辨識 自然語言處理:處理文字 語音辨識:先把聲音轉成文字 最關鍵的區別:先看它是在比什麼,再看它怎麼做。
記住這句就好
人話要先變成電腦看得懂的資料。
實際案例
搜尋引擎 把查詢切詞、去停用詞、理解意圖,找出最相關頁面。
客服系統 把使用者輸入分成意圖、實體、和回覆內容,再走後續流程。
算法與應用
NLP 的工作鏈很長,常包含文字前處理、特徵表示、理解、與生成。 現代 NLP 幾乎都離不開語言模型。 它的難點在語意、上下文、歧義和跨語言差異。
情境判斷
Q1(直覺題): 你要讓系統看懂一句中文並判斷意圖,這屬於什麼?
Q2(判斷題): 如果一個系統只有文字輸入,沒有聲音,也沒有影像,還算 NLP 嗎?
iPAS 考題
Q:自然語言處理最常做的事情有哪些? → 分詞、分類、資訊抽取、問答、生成,核心是把人話變成可計算的資料。
Q:為什麼中文 NLP 一開始常先做分詞? → 因為中文沒有明確空格切詞,電腦需要先把句子切成可處理的單位。
常見問題
NLP 和 AI 是一樣嗎?
不是,NLP 只是 AI 的一個分支。
它一定要用深度學習嗎?
不一定,傳統統計方法也屬於 NLP。
分詞為什麼常被提到?
因為它是中文 NLP 最基礎的前處理步驟之一。