iPAS AI 應用規劃師初級　科目一　人工智慧基礎概論

標本少、成本高，用哪個 AI 策略最划算？

原題 49

某 AI 科技公司在工業缺陷檢測領域已有成熟的辨識產品經驗。現欲與新客戶合作開發一項類似產品的表面瑕疵檢測系統，但因新產品量產不久，標注樣本極為稀少且專家標注成本高昂。在不大幅增加標注預算的前提下，下列哪一種做法最能利用該公司既有的技術優勢來提升模型表現？

白話

某 AI 科技公司在工業缺陷檢測領域已有成熟的辨識產品，現在要和新客戶合作開發類似產品的表面瑕疵檢測系統。但新產品量產不久，標注樣本極少、標注成本又高，而且限制條件是不能大幅增加標注預算。

問你：在不大幅增加標注預算的前提下，哪種做法最能利用這家公司既有的技術優勢來提升模型表現？

點選你的答案。

← 回 50 題列表回 iPAS 備考總覽

01　總結

一句話總結

舊模型學過類似任務的視覺特徵，新任務只要少量樣本就能微調，遷移學習直接利用既有預訓練模型的知識，不需要大量標注就能達到好效果。

02　情境

先感受問題：舊產品學了三年，新產品卻只有 50 張標注圖

想像你是「精準視覺科技」的 AI 主管。公司幫 A 客戶做了三年的 PCB 電路板缺陷檢測，累積了 10 萬張標注影像，訓練出一個很強的模型：能分辨焊點不良、線路斷裂、元件位移等各種缺陷。

現在 B 客戶找上門，說他們做的是汽車引擎蓋的表面塗裝瑕疵檢測（刮傷、氣泡、色差），產品剛量產，只有 50 張有標注的瑕疵影像，而且每張都要請有 20 年經驗的品管師傅來標，一張標注費要 2000 元。

你的挑戰：50 張照片，從頭訓練根本不夠。重新蒐集標注又太貴。但你有一個學過「辨識表面異常」的模型。有沒有辦法把 PCB 的舊模型的知識搬到塗裝瑕疵任務上？

這就是遷移學習要解決的問題。

03　對照

從頭訓練新模型的五個代價

需要大量標注資料：從零開始訓練一個工業視覺模型，通常需要幾千到幾萬張標注影像，新產品只有 50 張，遠遠不夠
標注成本極高：B 客戶的標注每張 2000 元，要達到可訓練的最低需求 1000 張就要 200 萬元，這個成本合同金額可能都不夠
浪費既有知識：公司花三年積累的 PCB 缺陷辨識能力完全棄置不用，等於前三年的技術投資歸零
開發時間長：從頭收集資料、標注、訓練、驗證，可能需要 6-12 個月，客戶等不及
錯誤重蹈：PCB 模型已經學會了「影像邊緣偵測」「紋理識別」「局部異常定位」這些底層視覺技能，從頭訓練要重新學這些基礎，白費時間

「精準視覺科技」的第一個方案是「重新標注 1000 張」，算完費用後 B 客戶說預算不夠，合作差點告吹。

04　解法

遷移學習怎麼解

遷移學習的核心思維是：已經在大量資料上訓練好的模型，學到的底層特徵是通用的，可以直接搬到新任務上用，只需要用少量新資料微調最後幾層。

對「精準視覺科技」的操作：

第一步，把 PCB 缺陷模型的「特徵提取層」拿出來，這些層學到的是「如何偵測影像中的異常紋理、邊緣變化、顏色差異」，這些技能在塗裝瑕疵任務裡一樣有用。

第二步，凍結前面幾層的參數（不讓它們更新），只訓練最後幾層（輸出層和分類器），用 B 客戶的 50 張標注影像微調這部分。

第三步，因為只訓練少量層，50 張影像就足夠讓模型學會「塗裝瑕疵的特定特徵」，不需要重新學視覺基礎。

結果：開發時間從 6 個月縮短到 3 週，標注成本從 200 萬降到 10 萬（50 張）。

這就是選項 D 講的：採用遷移學習（Transfer Learning），利用既有預訓練模型進行調整。

技術版：遷移學習在工業 AI 的位置與做法

遷移學習（Transfer Learning）是解決「標注資料不足」問題最有效的策略之一，在工業視覺、醫療影像、自然語言處理等領域廣泛應用。核心假設是：在大型任務上學到的特徵表示，對小型相關任務同樣有效。

遷移學習的兩種主要做法：

特徵提取（Feature Extraction）：完全凍結預訓練模型，只用它當特徵提取器，把輸出特徵送進新的分類器。適合來源任務和目標任務非常相似時。
微調（Fine-tuning）：凍結前幾層（通用特徵），允許後幾層更新（任務特定特徵）。適合有少量標注資料、目標任務和來源任務有一定差異時。

為什麼工業缺陷檢測之間的遷移有效：PCB 缺陷和塗裝瑕疵雖然是不同產品，但底層視覺特徵有很多共通點：都需要偵測表面紋理異常、邊緣不規則、顏色變化。這些特徵在預訓練模型的淺層已經被充分學習，遷移效果好。

遷移學習 vs. 從頭訓練的選擇標準：當有充足標注資料（幾萬張以上）且目標任務和來源任務差異很大時，從頭訓練效果可能更好。當標注資料少（幾十到幾千張）且任務相似時，遷移學習幾乎一定更好。

為什麼出題者要考這題：AI 應用規劃師在設計新專案時，必須能判斷「是否有既有資源可以遷移」，而不是每次都從零開始。這題在測試能否識別「有相關預訓練模型 + 標注少」這個遷移學習的完美使用場景。

05　陷阱

為什麼其他選項是錯的

A增加模型參數規模，使模型具備更強表達能力

字面在說什麼

用更大、更複雜的神經網路架構，增加層數或每層的神經元數量。

為什麼不對

當訓練資料只有 50 張時，更大的模型反而更容易過擬合：把 50 張訓練樣本完全記住，但對新影像毫無預測能力。題目的限制是「資料少」，增加模型規模只會讓問題更嚴重。沒有遷移舊知識，更大的模型學不到任何有用的東西。

誰會選錯

認為「模型越大效果越好」的人。模型規模和效果的關係取決於資料量，資料少的時候大模型容易過擬合。遷移學習能解決資料少的問題，加大模型不行。

B透過資料增強（Data Augmentation）擴展影像變化，以提升模型穩定性

字面在說什麼

對 50 張原始影像做翻轉、旋轉、亮度調整、裁切等操作，把 50 張變成幾千張「虛擬」訓練樣本。

為什麼不對

資料增強是個好方法，但它無法憑空創造新的瑕疵模式，只能讓現有的 50 個瑕疵從不同角度被看到。而且這 50 張很可能無法涵蓋所有瑕疵類型，資料增強後仍然是資料多樣性嚴重不足。相比之下，遷移學習直接帶來了「已學會辨識視覺異常」的能力，是質量上的提升，資料增強只是量的擴充。

誰會選錯

知道資料增強能擴展訓練集但忽視了「遷移學習帶來的是模型知識而非資料量」的人。兩者可以並用，但題目問的是哪個最能「利用既有技術優勢」，那一定是遷移學習。

C重新蒐集大量影像並進行完整人工標註

字面在說什麼

不管既有模型，從頭開始收集新產品的大量瑕疵影像，花錢請專家標注。

為什麼不對

題目明確說「在不大幅增加標注預算的前提下」，這個選項直接違反了題目的約束條件。此外，這個做法完全放棄了公司三年積累的技術優勢，等於浪費了既有資產。

誰會選錯

沒有讀到「不大幅增加標注預算」這個約束、或認為「從頭來最可靠」的人。讀題時要把限制條件劃出來，違反限制的選項直接排除。

06　變形

同個考點下次怎麼變形

變形 1

遷移學習的「來源任務」和「目標任務」相似度越高，效果越好嗎？

直覺

應該是越像越好？

答案

是的，相似度高遷移效果通常更好。PCB 缺陷 → 塗裝瑕疵：都是工業表面視覺異常，相似度高，遷移效果好。ImageNet 分類 → 醫療 X 光：差異較大，但底層視覺特徵（邊緣、紋理）仍有共通性，仍有遷移效果但不如前者。自然語言 → 圖像：差異過大，通常不做跨模態遷移（除非特別設計）。

變形 2

資料增強（Data Augmentation）和遷移學習，兩者可以同時用嗎？

直覺

兩個方法看起來目的不同，應該不衝突？

答案

完全可以同時用，而且通常一起用效果更好。遷移學習提供強大的預訓練特徵作為起點，資料增強讓少量標注樣本更多樣化。在標注資料少的場景，兩者組合是工業 AI 的標準做法：先用預訓練模型遷移，再用資料增強擴充訓練集，兩者互補。

變形 3

Fine-tuning（微調）和 Feature Extraction（特徵提取）在遷移學習中有什麼差別？

直覺

都是遷移學習，有什麼不同的地方？

答案

特徵提取：預訓練模型完全凍結，只用它輸出的特徵向量，接一個簡單分類器訓練。速度快、資料要求最少，但效果受限於預訓練特徵的遷移性。微調：解凍模型的後幾層，讓它們也隨新資料更新。需要稍多資料，效果通常更好，因為模型能針對新任務調整特徵表示。資料越少，凍結越多層；資料越多，可以讓越多層更新。

變形 4

預訓練模型（Pre-trained Model）在遷移學習中扮演什麼角色？

直覺

預訓練模型就是在其他資料集上練過的模型？

答案

預訓練模型是在大型資料集（如 ImageNet 的 120 萬張圖、Common Crawl 的幾千億個文字 token）上訓練好的模型。它已經學到豐富的通用特徵表示，在新任務上作為「起點」，讓模型不需要從隨機初始化開始學習。就像一個已經學會走路的小孩要學騎腳踏車，比從零開始學走路的嬰兒學騎車快很多。

變形 5

主動學習（Active Learning）在「標注預算有限」的場景有什麼作用？

直覺

遷移學習解決了標本少的問題，還有其他方法嗎？

答案

主動學習讓模型主動選擇「它最不確定的樣本」請人類來標注，而不是隨機選樣本標注。這樣每一筆標注預算花在最能提升模型能力的樣本上，用少量標注達到最大效益。遷移學習和主動學習可以組合：用預訓練模型做初始預測，再用主動學習策略選最值得標注的樣本，最終用很少的標注成本達到很好的效果。

07　延伸

想再往下看，這 5 個

遷移學習（Transfer Learning）將既有任務學到的知識應用到新任務，是標注資料稀少時最有效利用技術優勢的方法
微調（Fine-tuning）在預訓練模型基礎上以少量資料繼續訓練，是遷移學習落地的主要操作方式
資料擴增術（Data Augmentation）對少量樣本做翻轉、旋轉等隨機變換擴充訓練集，緩解標注資料不足但無法取代真實樣本多樣性
少樣本學習（Few-shot Learning）以極少量標注樣本完成新任務學習，常與遷移學習結合，適合標注成本高的工業場景
半監督學習（Semi-supervised Learning）同時利用少量已標注與大量未標注資料訓練，是低標注預算下擴充有效訓練信號的另一選項