擴散模型 是什麼?

Diffusion Model — 擴散模型 的完整解釋

擴散模型是一種生成模型,透過逐步將雜訊還原成清晰圖像,達成從隨機雜訊生成資料的目的

容易混淆

vs 生成對抗網路 (GAN) GAN 像兩個藝術家互相較勁,一個生成一個評審;擴散模型則像一個藝術家,從雜亂的畫布上逐步「擦除」雜訊,讓畫面越來越清晰。GAN 常常訓練不穩定,擴散模型在生成品質和穩定性上表現更好。

深度學習 vs 生成對抗網路 深度學習 比較像同一類問題裡的近鄰參考,生成對抗網路 則更像把資料或結構往更深一層整理,兩者的用法不一樣。

最關鍵的區別: 先看它是在做「理解、生成、分組、保護」哪一件事,再看細節。

記住這句就好

從噪聲分布裡,一步步還原出內容

實際案例

案例一:擴散模型 生成插圖 你給它一個提示詞,它不是一次畫完,而是先產出亂圖,再一輪一輪把噪聲修掉,最後得到清晰圖片。

案例二:擴散模型 做超解析或修復 模型會把模糊或低解析度的輸入逐步補細節,讓圖像越來越像真的,而不是只做一次性放大。

深入了解

擴散模型先把資料逐步加噪,再學反向去噪,兩個過程像鏡像 因為每一步都比對「少一點噪聲」,訓練通常比 GAN 穩 代價是採樣步數多,所以生成速度常常慢一些

擴散模型 真正重要的,不是名詞本身,而是它幫你解決的是哪一類問題。

情境判斷

Q1(直覺題): AI 要生成圖片時,是先從雜訊慢慢修回來比較穩,還是直接一次畫完比較穩? → 先從雜訊慢慢修回來通常更穩,這就是擴散模型的核心思路。

Q2(判斷題): 如果生成速度很重要,擴散模型還一定是最佳選擇嗎? → 看情況,因為它常比 GAN 穩,但採樣步數多、速度慢,若場景很吃即時性,就要考慮加速技巧或其他架構。

擴散模型 在 iPAS 考試中的重點

根據歷年統計,擴散模型 相關題目 平均佔 AI 技術類考題 4%, 屬於未分類考範圍。

常見出題方向:生成式 AI 模型原理(40%)、深度學習模型架構(35%)、影像生成與處理技術(25%)。

相關術語

常見問題

擴散模型如何應用於影像超解析度?

擴散模型可以學習將低解析度影像逐步去噪,還原成高解析度影像。模型會學習從低解析度影像中預測缺失的細節,並逐步添加這些細節,最終生成一張清晰的高解析度影像。這種方法通常能產生比傳統方法更逼真的結果。

擴散模型在訓練時需要大量的資料嗎?

是的,擴散模型通常需要大量的訓練資料才能達到良好的生成效果。這是因為模型需要學習從各種不同程度的雜訊中還原出原始資料,這需要大量的樣本來覆蓋不同的資料分布。但隨著技術發展,也有研究致力於減少擴散模型對資料的需求。

如何評估擴散模型生成圖像的品質?

評估擴散模型生成圖像的品質可以使用多種指標,例如Inception Score (IS)、Fréchet Inception Distance (FID) 等。這些指標可以衡量生成圖像的多樣性和真實性。此外,也可以透過人工評估的方式,讓人類判斷生成圖像的品質。

資料來源

← 回到 擴散模型 快查頁

測驗你對 擴散模型 的理解

透過模擬考系統檢驗學習成果

開始測驗