DM（擴散模型）是什麼？完整定義與解說

iPAS 生成式AI深度學習

你看過 AI 從雜訊慢慢畫出清晰圖片嗎？ 你可以把擴散模型想成先打亂、再重建的生成流程。它其實就是先把資料一步步加噪，再學會把噪聲一步一步去掉。擴散模型是一種生成模型，透過逐步將雜訊還原成清晰圖像，達成從隨機雜訊生成資料的目的。這種逆向修復的思路，通常能換來更穩定的訓練和更細緻的生成品質。

容易混淆

vs 生成對抗網路 (GAN) GAN 像兩個藝術家互相較勁，一個生成一個評審；擴散模型則像一個藝術家，從雜亂的畫布上逐步「擦除」雜訊，讓畫面越來越清晰。GAN 常常訓練不穩定，擴散模型在生成品質和穩定性上表現更好。

深度學習 vs 生成對抗網路 深度學習比較像同一類問題裡的近鄰參考，生成對抗網路則更像把資料或結構往更深一層整理，兩者的用法不一樣。

最關鍵的區別： 先看它是在做「理解、生成、分組、保護」哪一件事，再看細節。

記住這句就好

從噪聲分布裡，一步步還原出內容

實際案例

案例一：擴散模型生成插圖 你給它一個提示詞，它不是一次畫完，而是先產出亂圖，再一輪一輪把噪聲修掉，最後得到清晰圖片。

案例二：擴散模型做超解析或修復 模型會把模糊或低解析度的輸入逐步補細節，讓圖像越來越像真的，而不是只做一次性放大。

深入了解

擴散模型先把資料逐步加噪，再學反向去噪，兩個過程像鏡像因為每一步都比對「少一點噪聲」，訓練通常比 GAN 穩代價是採樣步數多，所以生成速度常常慢一些

擴散模型真正重要的，不是名詞本身，而是它幫你解決的是哪一類問題。

情境判斷

Q1（直覺題）： AI 要生成圖片時，是先從雜訊慢慢修回來比較穩，還是直接一次畫完比較穩？ → 先從雜訊慢慢修回來通常更穩，這就是擴散模型的核心思路。

Q2（判斷題）： 如果生成速度很重要，擴散模型還一定是最佳選擇嗎？ → 看情況，因為它常比 GAN 穩，但採樣步數多、速度慢，若場景很吃即時性，就要考慮加速技巧或其他架構。

iPAS 考題

Q：擴散模型的生成過程為什麼要先加噪？ 先把資料破壞成可控的噪聲，再學逆向去噪，模型比較穩，也比較容易學到資料分布。

Q：擴散模型在考題裡常考什麼？ 常考加噪與去噪的雙向過程、和 GAN 的差別，以及生成品質和速度的取捨。

常見問題

擴散模型如何應用於影像超解析度？

擴散模型可以學習將低解析度影像逐步去噪，還原成高解析度影像。模型會學習從低解析度影像中預測缺失的細節，並逐步添加這些細節，最終生成一張清晰的高解析度影像。這種方法通常能產生比傳統方法更逼真的結果。

擴散模型在訓練時需要大量的資料嗎？

是的，擴散模型通常需要大量的訓練資料才能達到良好的生成效果。這是因為模型需要學習從各種不同程度的雜訊中還原出原始資料，這需要大量的樣本來覆蓋不同的資料分布。但隨著技術發展，也有研究致力於減少擴散模型對資料的需求。

如何評估擴散模型生成圖像的品質？

評估擴散模型生成圖像的品質可以使用多種指標，例如Inception Score (IS)、Fréchet Inception Distance (FID) 等。這些指標可以衡量生成圖像的多樣性和真實性。此外，也可以透過人工評估的方式，讓人類判斷生成圖像的品質。

範例考題

某時尚品牌導入生成式 AI（Generative AI）技術，建立服裝設計輔助系統。系統需根據設計師輸入的風格條件，自動產生具有高度視覺品質、細節穩定且風格變化自然的服裝草圖。團隊特別重視生成結果的穩定性與多樣性控制能力。在此需求下，下列哪一種模型技術或方法較為適合？

A. 支援向量機（Support Vector Machine, SVM）
B. 生成對抗網路（Generative Adversarial Network, GAN）
C. 決策樹（Decision Tree）
D. 擴散模型（Diffusion Model） ✓ 正確答案

解析：

擴散模型（Diffusion Model）在圖像生成方面具有優秀的穩定性與多樣性控制能力，生成品質高且細節穩定。相較於 GAN 容易出現模式崩塌問題，擴散模型的訓練更穩定，生成結果品質更可控。

擴散模型（Diffusion Model）是什麼？

容易混淆

記住這句就好

實際案例

深入了解

情境判斷

iPAS 考題

常見問題

範例考題

立即測驗

容易混淆

記住這句就好

實際案例

深入了解

情境判斷

iPAS 考題

常見問題

相關術語

範例考題

延伸學習

立即測驗

資料來源與參考依據