穩定擴散(Stable Diffusion)是什麼?

Stable Diffusion 是一種潛在擴散模型,用於根據文字描述生成高質量圖像,透過迭代去噪過程,從隨機噪聲中產生逼真圖像。|本頁含完整原理、應用場景、iPAS 考試重點與 3 個常見問答。

穩定擴散(Stable Diffusion)是什麼? 生成式AI電腦視覺

你有沒有想過,文字或圖片送進模型後,能不能直接變成圖像、立體模型,甚至更好看的結果?

你可以把它想成把素材重新整理成可看、可用的內容。 穩定擴散 的重點是 Stable Diffusion 是一種潛在擴散模型,用於根據文字描述生成高質量圖像,透過迭代去噪過程,從隨機噪聲中產生逼真圖像。 它重要,是因為生成品質、控制能力和速度,會直接影響實際可用性。

容易混淆

穩定擴散 vs 擴散模型 穩定擴散:偏向 把條件轉成可看結果 擴散模型:偏向 更大的生成家族 最關鍵的區別:穩定擴散看的是「把條件轉成可看結果」,擴散模型看的是「更大的生成家族」。

穩定擴散 vs 去噪擴散機率模型 穩定擴散:偏向 把條件轉成可看結果 去噪擴散機率模型:偏向 更標準的擴散模型寫法 最關鍵的區別:穩定擴散看的是「把條件轉成可看結果」,去噪擴散機率模型看的是「更標準的擴散模型寫法」。

記住這句就好

先看它是在生內容,還是在改內容。

實際案例

案例:行銷團隊先出一版商品視覺 先用模型快速試色和試風格,再決定要不要進設計流程

案例:老照片太模糊,想救回細節 先放大再補細節,比單純拉伸更有機會看清楚

算法與應用

先建立可生成的表示,再一步步補細節 提示詞、參考圖和推論設定,常會一起影響成品 常見用途是生圖、修圖、放大和視覺理解

情境判斷

Q1(直覺題): 你要把一張模糊照片修清楚,這類方法有沒有用? → 有,超解析度或相關生成式方法就是在做這件事。

Q2(判斷題): 你只有一張很小的產品照,想直接拿去印大海報,這時候一定要用生成式方法嗎? → 看情況,如果只是放大到可讀,傳統插值可能夠;如果要補細節,才需要更強的方法。

常見問題

這類方法最常用在哪裡?

在需要快速出視覺稿、修圖、放大或跨風格轉換的場景,最容易看到價值。

為什麼成品有時會跑掉?

因為提示詞、參考圖、步數和模型版本都會改變結果,控制變數越少,成品越穩。

這類方法和單純修圖有什麼不同?

修圖通常是手動改局部,這類方法會讓模型根據條件重新生成或補出結果。