你有沒有遇過模型沒看過這個類別,卻還希望它直接判斷?
你可以把零樣本學習想成,模型沒看過範例,也能靠先前學到的知識和類別描述去猜新類別。
它重要,是因為很多新任務根本沒有足夠標註資料,但系統又不能等資料慢慢補齊。
你可以把它想成一個把抽象概念拉回日常判斷的提示,先知道它解決什麼問題,再看技術細節。
容易混淆
零樣本學習 vs 少樣本學習 零樣本學習沒有示範例子,少樣本學習還是會給幾個例子。
零樣本學習 vs 監督式學習 監督式學習通常要大量標註資料,零樣本學習則靠既有知識和語意關係推斷。
零樣本學習 vs 遷移學習 遷移學習是把舊能力搬到新任務,零樣本學習則是連新類別的示範都不給。
最關鍵的區別:零樣本是「沒看過例子也要會」。
記住這句就好
沒例子,也要能靠知識猜出來。
實際案例
新商品分類 電商剛上架一批全新商品,還沒時間標很多資料,系統可以根據商品描述和類別名稱先做初步分類。
跨語言任務 模型沒看過某些語言的標註資料,仍能靠訓練時學到的語意關聯處理部分任務。
算法與應用
零樣本學習常把類別名稱、文字描述或屬性當成橋樑,讓模型從已知類別推到未知類別。
它常出現在圖像分類、文字分類、檢索和大型語言模型的提示式任務裡。
真正的挑戰不是「能不能猜」,而是「在沒示範的情況下,猜得穩不穩」。
情境判斷
Q1(直覺題): 模型沒看過「砂糖橘」這個類別,但看描述後能判成柑橘類,這算零樣本嗎?
→ 算,因為它沒有看過這個類別的訓練範例,是靠語意描述推斷。
Q2(判斷題): 如果模型只靠一兩個標註範例就做出判斷,這還是零樣本嗎?
→ 不是,這更接近少樣本學習。零樣本的關鍵是沒有示範例子。
iPAS 考題
出題方向: 常考零樣本、少樣本、遷移學習之間的差異,還有它在資料不足時的用途。
Q:零樣本學習最核心的特徵是什麼? → 沒有目標類別的訓練範例,仍能利用預訓練知識進行判斷。
Q:哪一種情況最接近零樣本學習? → 模型沒看過新類別的標註樣本,只靠類別描述或語意關聯做分類。
常見問題
零樣本學習準嗎?
會比有充分資料的監督式學習不穩,但在資料很少的情況下很有價值。
零樣本學習一定要大型語言模型嗎?
不一定,但大型語言模型讓零樣本任務更常見,也更容易做。
零樣本學習和提示工程有關嗎?
有關,很多 LLM 的零樣本能力就是透過好的提示語觸發。
零樣本學習能取代人工標註嗎?
不能完全取代,但可以先把初版系統做起來,降低冷啟動成本。