弱監督學習 是什麼?
Weak Supervision — 弱監督學習 的完整解釋
弱監督學習利用不精確、不完整或帶有雜訊的標籤資料來訓練機器學習模型,降低對大量精確標註資料的依賴。
容易混淆
弱監督學習 vs 半監督學習 半監督學習是少量有標註、很多沒標註;弱監督學習是標註本身不精準或不完整。
弱監督學習 vs 監督學習 監督學習依賴高品質標註,弱監督學習會接受較吵的標籤來源。
弱監督學習 vs 程式化標註 程式化標註是產生弱標籤的方法之一,弱監督學習則是整體訓練思路。
最關鍵的區別:弱監督是標籤不完美,不是資料完全沒標。
記住這句就好
標籤不夠準,也能先拿來學。
實際案例
客服郵件分類 你先用規則把「退款、退貨、取消」的郵件標成高風險,再讓模型去學,之後再用人工抽查修正。
電商商品標籤 商品描述常又長又亂,人工逐筆標註成本很高,先用字典、關鍵字和規則產生弱標籤,能先把基礎分類做起來。
算法與應用
弱監督常會把多個弱標籤來源整合起來,再估計哪個來源比較可靠。
常見流程是先設計標註規則,再合併多個規則的輸出,最後用乾淨一點的驗證集檢查效果。
它特別常出現在資料標註昂貴、但規則又能部分描述任務的情境。
情境判斷
Q1(直覺題): 你用幾條規則先標出垃圾信,再拿這些標籤訓練模型,這算弱監督嗎?
→ 算,因為標籤來源不是完全人工精標,而是帶規則和雜訊的弱標籤。
Q2(判斷題): 如果你只有少量人工標註、其餘資料都沒標籤,這還是弱監督嗎?
→ 不一定,這更像半監督學習。要看你是「標籤不準」還是「標籤很少」。
相關術語
常見問題
弱監督的標籤不準,模型不是會學壞嗎?
會有風險,所以通常要結合多個來源、做去噪和驗證,不能直接全信。
弱監督一定比人工標註差嗎?
不一定,當資料量很大、規則品質也不錯時,弱監督常能先做出夠用的模型。
弱監督可以跟人工標註一起用嗎?
可以,而且很常這樣做。人工標註通常拿來當高品質驗證或修正來源。
弱監督適合什麼任務?
適合分類、偵測、資訊抽取這類能靠規則或外部知識產生部分標籤的任務。