你有沒有想過,模型架構不是慢慢手調就好嗎?
你可以把它想成,AI 要先找出「哪種網路骨架最適合」,但如果每個候選架構都從頭訓練一次,成本會高到嚇人。
高效 NAS 就是在省算力的前提下找好架構,讓研究團隊不用燒掉一整個資料中心,還能挑到表現夠好的模型。
容易混淆
高效 NAS vs 傳統 NAS 傳統 NAS 每個候選架構都可能要完整訓練一次。 高效 NAS 會用共享權重、代理模型、提前停止等方法減少重複計算。 最關鍵的區別:是不是每次都從零開始。
高效 NAS vs 超參數調校 超參數調校改的是學習率、批次大小、正則化強度這類設定。 高效 NAS 改的是網路結構本身,例如層數、連接方式、模組排列。 最關鍵的區別:調的是訓練設定,還是模型骨架。
高效 NAS vs 手工設計 手工設計靠研究者經驗慢慢試。 高效 NAS 用演算法批量搜尋,更適合搜尋空間大、時間少的情境。 最關鍵的區別:人工直覺,還是演算法搜尋。
記住這句就好
不是每個候選都訓練到底,才叫高效 NAS。
實際案例
新創公司要做手機辨識模型 團隊沒有很多 GPU,不能把幾千個架構全部跑完。 Before:靠經驗手選架構。After:用高效 NAS 快速縮小候選,先找到夠好的版本再微調。
研究團隊要找低延遲影像模型 如果目標是部署到邊緣裝置,架構不只要準確,還要小、快、省電。 Before:只看驗證準確率。After:把延遲、參數量、運算量一起納入搜尋條件。
算法與應用
高效 NAS 常見做法包括權重共享、可微分搜尋、代理模型、早停與多目標搜尋。
做法不同,但目的相同:把「訓練一個架構再評估」變成「用更少成本估計很多架構」。
如果算力很少,先縮小搜尋空間;如果要上線,還要把延遲和記憶體一起納進目標函數。
情境判斷
Q1(直覺題): 你只有兩張 GPU,卻要替影像分類任務找新架構。怎麼做比較實際?
→ 先用高效 NAS,不要直接做傳統 NAS。你真正缺的是搜尋效率,不是候選數量。
Q2(判斷題): 搜尋結果很快,但候選模型在真實資料上表現不穩。問題可能在哪?
→ 看情況。可能是代理任務和真實任務落差太大,或搜尋空間設得太鬆。這時要回頭檢查搜尋目標,而不是只看速度。
常見問題
高效 NAS 和 AutoML 一樣嗎?
不完全一樣。高效 NAS 是 AutoML 的一部分,專門處理神經網路架構搜尋,而且重點是節省計算。
高效 NAS 一定比手工設計好嗎?
不一定。若你對架構已有很深經驗,手工設計仍可能更快;高效 NAS 的強項是大規模搜尋。
高效 NAS 的主要瓶頸是什麼?
常見瓶頸是搜尋空間定義、代理任務和真實任務的落差,以及算力和時間限制。