語言模型 是什麼?
Language Model — 語言模型 的完整解釋
語言模型是一種機器學習模型,用於預測給定文本序列中下一個詞彙或字符的概率分佈,是自然語言處理的基礎。
容易混淆
大型語言模型 語言模型是總稱,大型語言模型是規模更大、通常建立在 Transformer 上的版本。
字典 字典只存定義,語言模型會學詞與詞怎麼接、在哪些語境出現。
記住這句就好
看前文,猜下一個。
實際案例
手機輸入法 打出「今天天氣很」時,系統會猜下一個常見詞,這就是語言模型在運作。
機器翻譯 模型要先理解前後語境,再決定下一個字該怎麼接,才能翻得順。
算法與應用
傳統 n-gram 語言模型只看前幾個詞,神經網路語言模型和 Transformer 則能看更長上下文。評估時常看困惑度,越低代表越會猜。
情境判斷
Q1(直覺題): 如果你現在遇到一個 手機輸入法 的場景,這個概念會是第一個想到的工具嗎? → 看情況,但如果任務目標和這個概念的用途一致,就很可能是。核心還是先確認你要解決的是分類、分群、壓縮、檢索,還是最佳化。
Q2(判斷題): 如果你把它和 字典 一起用,結果反而變不穩,通常該怎麼想? → 看情況。先檢查資料分布、特徵定義和模型假設是否相容,很多時候不是概念本身有問題,而是使用條件不對,像距離尺度沒對齊、標註規則不一致,或輸入格式不合。
相關術語
常見問題
語言模型 最容易跟 大型語言模型 混淆嗎?
語言模型是總稱,大型語言模型是規模更大、通常建立在 Transformer 上的版本。
什麼情況會用到 語言模型?
你可以把它想成一個專門猜下一個字或詞的語言機器,根據前文預測後面最可能出現什麼。 實務上只要你要處理和這個概念相符的任務,就會用到它。
初學者最常錯在哪裡?
字典只存定義,語言模型會學詞與詞怎麼接、在哪些語境出現。