基礎模型 是什麼?
Foundation Model — 基礎模型 的完整解釋
基礎模型是使用大量未標記數據訓練的大型模型,可適應多種下游任務,展現出強大的泛化能力和遷移學習能力。
容易混淆
基礎模型 vs 傳統AI模型 傳統模型常為單一任務設計。 基礎模型先學通用能力,再適配不同任務。
基礎模型 vs 大型語言模型 大型語言模型是基礎模型的常見例子。 但基礎模型不只限於文字,也可以涵蓋影像和多模態。
記住這句就好
先學通用底子,再拿去改成不同用途,就是基礎模型。
實際案例
客服和摘要共用底座 同一個大型基礎模型,先做摘要再做客服回覆,只要調整任務層就能延伸。
企業知識助理 先用通用模型打底,再針對公司文件微調,會比從零開始快很多。
算法與應用
它通常靠大規模預訓練學到一般性的表示能力,再透過提示或微調進入特定任務。 在文字、影像和多模態領域,基礎模型都已經成為很常見的起點。
情境判斷
Q1:如果一個模型能做很多任務,通常可以說它很像基礎模型嗎? → 可以,但前提是它真的有通用預訓練底座,不只是臨時拼出多功能。
Q2:只要模型很大,就一定是基礎模型嗎? → 不一定,大小不是唯一標準,能不能當通用底座才是關鍵。
相關術語
常見問題
基礎模型一定要超大嗎?
不一定,但通常要有足夠廣泛的預訓練能力。
它和微調的關係是什麼?
基礎模型是底座,微調是把底座改成特定任務版本。
和少樣本學習有關嗎?
有關,好的基礎模型常能用少量範例快速適應新任務。
基礎模型只存在於語言領域嗎?
不是,影像與多模態也都有。