擴散模型(Diffusion Model)是什麼?

擴散模型是一種生成模型,透過逐步將雜訊還原成清晰圖像,達成從隨機雜訊生成資料的目的|本頁含完整原理、應用場景、iPAS 考試重點與 3 個常見問答。

擴散模型(Diffusion Model)是什麼? iPAS 生成式AI深度學習

你看過 AI 從雜訊慢慢畫出清晰圖片嗎? 你可以把 擴散模型 想成先打亂、再重建的生成流程。 它其實就是先把資料一步步加噪,再學會把噪聲一步一步去掉。 擴散模型是一種生成模型,透過逐步將雜訊還原成清晰圖像,達成從隨機雜訊生成資料的目的。這種逆向修復的思路,通常能換來更穩定的訓練和更細緻的生成品質。

容易混淆

vs 生成對抗網路 (GAN) GAN 像兩個藝術家互相較勁,一個生成一個評審;擴散模型則像一個藝術家,從雜亂的畫布上逐步「擦除」雜訊,讓畫面越來越清晰。GAN 常常訓練不穩定,擴散模型在生成品質和穩定性上表現更好。

深度學習 vs 生成對抗網路 深度學習 比較像同一類問題裡的近鄰參考,生成對抗網路 則更像把資料或結構往更深一層整理,兩者的用法不一樣。

最關鍵的區別: 先看它是在做「理解、生成、分組、保護」哪一件事,再看細節。

記住這句就好

從噪聲分布裡,一步步還原出內容

實際案例

案例一:擴散模型 生成插圖 你給它一個提示詞,它不是一次畫完,而是先產出亂圖,再一輪一輪把噪聲修掉,最後得到清晰圖片。

案例二:擴散模型 做超解析或修復 模型會把模糊或低解析度的輸入逐步補細節,讓圖像越來越像真的,而不是只做一次性放大。

深入了解

擴散模型先把資料逐步加噪,再學反向去噪,兩個過程像鏡像 因為每一步都比對「少一點噪聲」,訓練通常比 GAN 穩 代價是採樣步數多,所以生成速度常常慢一些

擴散模型 真正重要的,不是名詞本身,而是它幫你解決的是哪一類問題。

情境判斷

Q1(直覺題): AI 要生成圖片時,是先從雜訊慢慢修回來比較穩,還是直接一次畫完比較穩? → 先從雜訊慢慢修回來通常更穩,這就是擴散模型的核心思路。

Q2(判斷題): 如果生成速度很重要,擴散模型還一定是最佳選擇嗎? → 看情況,因為它常比 GAN 穩,但採樣步數多、速度慢,若場景很吃即時性,就要考慮加速技巧或其他架構。

iPAS 考題

Q:擴散模型的生成過程為什麼要先加噪? 先把資料破壞成可控的噪聲,再學逆向去噪,模型比較穩,也比較容易學到資料分布。

Q:擴散模型在考題裡常考什麼? 常考加噪與去噪的雙向過程、和 GAN 的差別,以及生成品質和速度的取捨。

常見問題

擴散模型如何應用於影像超解析度?

擴散模型可以學習將低解析度影像逐步去噪,還原成高解析度影像。模型會學習從低解析度影像中預測缺失的細節,並逐步添加這些細節,最終生成一張清晰的高解析度影像。這種方法通常能產生比傳統方法更逼真的結果。

擴散模型在訓練時需要大量的資料嗎?

是的,擴散模型通常需要大量的訓練資料才能達到良好的生成效果。這是因為模型需要學習從各種不同程度的雜訊中還原出原始資料,這需要大量的樣本來覆蓋不同的資料分布。但隨著技術發展,也有研究致力於減少擴散模型對資料的需求。

如何評估擴散模型生成圖像的品質?

評估擴散模型生成圖像的品質可以使用多種指標,例如Inception Score (IS)、Fréchet Inception Distance (FID) 等。這些指標可以衡量生成圖像的多樣性和真實性。此外,也可以透過人工評估的方式,讓人類判斷生成圖像的品質。

範例考題

某時尚品牌導入生成式 AI(Generative AI)技術,建立服裝設計輔助系統。系統需根據設計師輸入的風格條件,自動產生具有高度視覺品質、細節穩定且風格變化自然的服裝草圖。團隊特別重視生成結果的穩定性與多樣性控制能力。在此需求下,下列哪一種模型技術或方法較為適合?

  • A. 支援向量機(Support Vector Machine, SVM)
  • B. 生成對抗網路(Generative Adversarial Network, GAN)
  • C. 決策樹(Decision Tree)
  • D. 擴散模型(Diffusion Model) ✓ 正確答案

解析:

擴散模型(Diffusion Model)在圖像生成方面具有優秀的穩定性與多樣性控制能力,生成品質高且細節穩定。相較於 GAN 容易出現模式崩塌問題,擴散模型的訓練更穩定,生成結果品質更可控。

立即測驗

想測試你對 擴散模型 的掌握程度? 開始模擬考