iPAS AI 應用規劃師 初級 科目一 人工智慧基礎概論

標本少、成本高,用哪個 AI 策略最划算?

原題 49

某 AI 科技公司在工業缺陷檢測領域已有成熟的辨識產品經驗。現欲與新客戶合作開發一項類似產品的表面瑕疵檢測系統,但因新產品量產不久,標注樣本極為稀少且專家標注成本高昂。在不大幅增加標注預算的前提下,下列哪一種做法最能利用該公司既有的技術優勢來提升模型表現?

白話

某 AI 科技公司在工業缺陷檢測領域已有成熟的辨識產品,現在要和新客戶合作開發類似產品的表面瑕疵檢測系統。但新產品量產不久,標注樣本極少、標注成本又高,而且限制條件是不能大幅增加標注預算。

問你:在不大幅增加標注預算的前提下,哪種做法最能利用這家公司既有的技術優勢來提升模型表現?

點選你的答案。

01 總結

一句話總結

舊模型學過類似任務的視覺特徵,新任務只要少量樣本就能微調,遷移學習直接利用既有預訓練模型的知識,不需要大量標注就能達到好效果

02 情境

先感受問題:舊產品學了三年,新產品卻只有 50 張標注圖

想像你是「精準視覺科技」的 AI 主管。公司幫 A 客戶做了三年的 PCB 電路板缺陷檢測,累積了 10 萬張標注影像,訓練出一個很強的模型:能分辨焊點不良、線路斷裂、元件位移等各種缺陷。

現在 B 客戶找上門,說他們做的是汽車引擎蓋的表面塗裝瑕疵檢測(刮傷、氣泡、色差),產品剛量產,只有 50 張有標注的瑕疵影像,而且每張都要請有 20 年經驗的品管師傅來標,一張標注費要 2000 元。

你的挑戰:50 張照片,從頭訓練根本不夠。重新蒐集標注又太貴。但你有一個學過「辨識表面異常」的模型。有沒有辦法把 PCB 的舊模型的知識搬到塗裝瑕疵任務上?

這就是遷移學習要解決的問題。

03 對照

從頭訓練新模型的五個代價

  1. 需要大量標注資料:從零開始訓練一個工業視覺模型,通常需要幾千到幾萬張標注影像,新產品只有 50 張,遠遠不夠
  2. 標注成本極高:B 客戶的標注每張 2000 元,要達到可訓練的最低需求 1000 張就要 200 萬元,這個成本合同金額可能都不夠
  3. 浪費既有知識:公司花三年積累的 PCB 缺陷辨識能力完全棄置不用,等於前三年的技術投資歸零
  4. 開發時間長:從頭收集資料、標注、訓練、驗證,可能需要 6-12 個月,客戶等不及
  5. 錯誤重蹈:PCB 模型已經學會了「影像邊緣偵測」「紋理識別」「局部異常定位」這些底層視覺技能,從頭訓練要重新學這些基礎,白費時間

「精準視覺科技」的第一個方案是「重新標注 1000 張」,算完費用後 B 客戶說預算不夠,合作差點告吹。

04 解法

遷移學習怎麼解

遷移學習的核心思維是:已經在大量資料上訓練好的模型,學到的底層特徵是通用的,可以直接搬到新任務上用,只需要用少量新資料微調最後幾層。

對「精準視覺科技」的操作:

第一步,把 PCB 缺陷模型的「特徵提取層」拿出來,這些層學到的是「如何偵測影像中的異常紋理、邊緣變化、顏色差異」,這些技能在塗裝瑕疵任務裡一樣有用。

第二步,凍結前面幾層的參數(不讓它們更新),只訓練最後幾層(輸出層和分類器),用 B 客戶的 50 張標注影像微調這部分。

第三步,因為只訓練少量層,50 張影像就足夠讓模型學會「塗裝瑕疵的特定特徵」,不需要重新學視覺基礎。

結果:開發時間從 6 個月縮短到 3 週,標注成本從 200 萬降到 10 萬(50 張)。

這就是選項 D 講的:採用遷移學習(Transfer Learning),利用既有預訓練模型進行調整

技術版:遷移學習在工業 AI 的位置與做法

遷移學習(Transfer Learning)是解決「標注資料不足」問題最有效的策略之一,在工業視覺、醫療影像、自然語言處理等領域廣泛應用。核心假設是:在大型任務上學到的特徵表示,對小型相關任務同樣有效。

遷移學習的兩種主要做法:

  • 特徵提取(Feature Extraction):完全凍結預訓練模型,只用它當特徵提取器,把輸出特徵送進新的分類器。適合來源任務和目標任務非常相似時。
  • 微調(Fine-tuning):凍結前幾層(通用特徵),允許後幾層更新(任務特定特徵)。適合有少量標注資料、目標任務和來源任務有一定差異時。

為什麼工業缺陷檢測之間的遷移有效:PCB 缺陷和塗裝瑕疵雖然是不同產品,但底層視覺特徵有很多共通點:都需要偵測表面紋理異常、邊緣不規則、顏色變化。這些特徵在預訓練模型的淺層已經被充分學習,遷移效果好。

遷移學習 vs. 從頭訓練的選擇標準:當有充足標注資料(幾萬張以上)且目標任務和來源任務差異很大時,從頭訓練效果可能更好。當標注資料少(幾十到幾千張)且任務相似時,遷移學習幾乎一定更好。

為什麼出題者要考這題:AI 應用規劃師在設計新專案時,必須能判斷「是否有既有資源可以遷移」,而不是每次都從零開始。這題在測試能否識別「有相關預訓練模型 + 標注少」這個遷移學習的完美使用場景。

05 陷阱

為什麼其他選項是錯的

A增加模型參數規模,使模型具備更強表達能力

字面在說什麼

用更大、更複雜的神經網路架構,增加層數或每層的神經元數量。

為什麼不對

當訓練資料只有 50 張時,更大的模型反而更容易過擬合:把 50 張訓練樣本完全記住,但對新影像毫無預測能力。題目的限制是「資料少」,增加模型規模只會讓問題更嚴重。沒有遷移舊知識,更大的模型學不到任何有用的東西。

誰會選錯

認為「模型越大效果越好」的人。模型規模和效果的關係取決於資料量,資料少的時候大模型容易過擬合。遷移學習能解決資料少的問題,加大模型不行。

B透過資料增強(Data Augmentation)擴展影像變化,以提升模型穩定性

字面在說什麼

對 50 張原始影像做翻轉、旋轉、亮度調整、裁切等操作,把 50 張變成幾千張「虛擬」訓練樣本。

為什麼不對

資料增強是個好方法,但它無法憑空創造新的瑕疵模式,只能讓現有的 50 個瑕疵從不同角度被看到。而且這 50 張很可能無法涵蓋所有瑕疵類型,資料增強後仍然是資料多樣性嚴重不足。相比之下,遷移學習直接帶來了「已學會辨識視覺異常」的能力,是質量上的提升,資料增強只是量的擴充。

誰會選錯

知道資料增強能擴展訓練集但忽視了「遷移學習帶來的是模型知識而非資料量」的人。兩者可以並用,但題目問的是哪個最能「利用既有技術優勢」,那一定是遷移學習。

C重新蒐集大量影像並進行完整人工標註

字面在說什麼

不管既有模型,從頭開始收集新產品的大量瑕疵影像,花錢請專家標注。

為什麼不對

題目明確說「在不大幅增加標注預算的前提下」,這個選項直接違反了題目的約束條件。此外,這個做法完全放棄了公司三年積累的技術優勢,等於浪費了既有資產。

誰會選錯

沒有讀到「不大幅增加標注預算」這個約束、或認為「從頭來最可靠」的人。讀題時要把限制條件劃出來,違反限制的選項直接排除。

06 變形

同個考點下次怎麼變形

變形 1

遷移學習的「來源任務」和「目標任務」相似度越高,效果越好嗎?

直覺

應該是越像越好?

答案

是的,相似度高遷移效果通常更好。PCB 缺陷 → 塗裝瑕疵:都是工業表面視覺異常,相似度高,遷移效果好。ImageNet 分類 → 醫療 X 光:差異較大,但底層視覺特徵(邊緣、紋理)仍有共通性,仍有遷移效果但不如前者。自然語言 → 圖像:差異過大,通常不做跨模態遷移(除非特別設計)。

變形 2

資料增強(Data Augmentation)和遷移學習,兩者可以同時用嗎?

直覺

兩個方法看起來目的不同,應該不衝突?

答案

完全可以同時用,而且通常一起用效果更好。遷移學習提供強大的預訓練特徵作為起點,資料增強讓少量標注樣本更多樣化。在標注資料少的場景,兩者組合是工業 AI 的標準做法:先用預訓練模型遷移,再用資料增強擴充訓練集,兩者互補。

變形 3

Fine-tuning(微調)和 Feature Extraction(特徵提取)在遷移學習中有什麼差別?

直覺

都是遷移學習,有什麼不同的地方?

答案

特徵提取:預訓練模型完全凍結,只用它輸出的特徵向量,接一個簡單分類器訓練。速度快、資料要求最少,但效果受限於預訓練特徵的遷移性。微調:解凍模型的後幾層,讓它們也隨新資料更新。需要稍多資料,效果通常更好,因為模型能針對新任務調整特徵表示。資料越少,凍結越多層;資料越多,可以讓越多層更新。

變形 4

預訓練模型(Pre-trained Model)在遷移學習中扮演什麼角色?

直覺

預訓練模型就是在其他資料集上練過的模型?

答案

預訓練模型是在大型資料集(如 ImageNet 的 120 萬張圖、Common Crawl 的幾千億個文字 token)上訓練好的模型。它已經學到豐富的通用特徵表示,在新任務上作為「起點」,讓模型不需要從隨機初始化開始學習。就像一個已經學會走路的小孩要學騎腳踏車,比從零開始學走路的嬰兒學騎車快很多。

變形 5

主動學習(Active Learning)在「標注預算有限」的場景有什麼作用?

直覺

遷移學習解決了標本少的問題,還有其他方法嗎?

答案

主動學習讓模型主動選擇「它最不確定的樣本」請人類來標注,而不是隨機選樣本標注。這樣每一筆標注預算花在最能提升模型能力的樣本上,用少量標注達到最大效益。遷移學習和主動學習可以組合:用預訓練模型做初始預測,再用主動學習策略選最值得標注的樣本,最終用很少的標注成本達到很好的效果。

07 延伸

想再往下看,這 5 個

出處

iPAS 經濟部產業人才能力鑑定 ・ 115 年第一次 iPAS AI 應用規劃師 初級 科目一 人工智慧基礎概論 第 49 題

查看官方原文 PDF