圖像生成 是什麼?

Image Generation — 圖像生成 的完整解釋

圖像生成是一種人工智慧技術,旨在從文字描述、其他圖像或隨機雜訊中創造出全新的、逼真的或風格化的圖像。

容易混淆

圖像生成 vs 圖像分類 分類是判斷圖是什麼 生成是創造新圖 最關鍵的區別是分析現有圖片,還是生成不存在的圖片

圖像生成 vs 文字生成圖像 文字生成圖像是圖像生成的一種 圖像生成還可以從雜訊、草圖或其他圖像出發 最關鍵的區別是應用方式,還是整體概念

記住這句就好

看描述,畫出不存在的圖。

實際案例

行銷草圖 設計師可以先用圖像生成做視覺草稿,再由人工修飾成正式素材。

遊戲素材 遊戲團隊常用圖像生成先產出場景或角色概念圖,省下大量初版繪圖時間。

算法與應用

現在常見的路線是擴散模型,效果穩定、細節也比較好。 不過圖像生成不代表真的理解世界,它更多是在學資料分布和風格。

情境判斷

Q1: 你想把一句產品描述變成海報草圖,會用什麼? → 圖像生成。

Q2: 你要從很多照片裡找出哪一張是貓,這還是圖像生成嗎? → 不是,這是圖像分類。

相關術語

常見問題

圖像生成需要很多資料嗎?

通常需要,尤其是要學出穩定風格時。

可以控制風格嗎?

可以,提示和模型選擇都會影響結果。

它有什麼風險?

深偽、版權和偏見都是常見問題。