Google 開放 Gemini 2.0 Flash 圖像生成功能預覽版，支援即時編輯與精準文字渲染

2025-05-08 12:20 　　鉅聞天下｜撰稿編輯中心

Google 於 8 日正式宣布，旗下多模態 AI 模型 Gemini 2.0 Flash 現已開放「圖像生成功能」預覽版。開發者可透過 Google AI Studio 與 Google Cloud 的 Vertex AI 平台，使用「gemini-2.0-flash-preview-image-generation 模型」進行整合開發與測試。

根據 Google 官方部落格說明，此次更新不僅開放圖像生成功能，同時提升了 API 呼叫頻率上限並優化價格彈性。相較於先前的實驗性版本，新版本在三大面向有顯著改善：提升生成圖片的視覺品質、增強文字渲染準確度，以及大幅降低過濾器封鎖率。

Google 表示，這項功能能協助開發者在多元應用場景中快速生成高品質圖像，特別適用於電商設計、內容創作、產品展示與 UI 試作等領域。實際應用包括：將商品圖片置換至不同背景情境實現情境式行銷、在 AI Studio 上進行即時協作繪圖、使用自然語言指定修改區域進行局部編輯、結合文字與圖像自動生成新商品 SKU 與包裝設計提案，以及作為創意夥伴協助用戶發想視覺與內容組合。

Google 已提供完整 API 串接方式，開發者可參考範例進行整合測試。目前圖像生成功能預覽版已全面開放，Google 也預告未來將持續提升模型品質、拓展功能並開放更高頻率的使用限制。

社群

Google 開放 Gemini 2.0 Flash 圖像生成功能預覽版，支援即時編輯與精準文字渲染

合作媒體

重要連結

社群

Google 開放 Gemini 2.0 Flash 圖像生成功能預覽版，支援即時編輯與精準文字渲染

相關新聞

也許您會感興趣

合作媒體

重要連結

社群