Google 於 8 日正式宣布,旗下多模態 AI 模型 Gemini 2.0 Flash 現已開放「圖像生成功能」預覽版。開發者可透過 Google AI Studio 與 Google Cloud 的 Vertex AI 平台,使用「gemini-2.0-flash-preview-image-generation 模型」進行整合開發與測試。
根據 Google 官方部落格說明,此次更新不僅開放圖像生成功能,同時提升了 API 呼叫頻率上限並優化價格彈性。相較於先前的實驗性版本,新版本在三大面向有顯著改善:提升生成圖片的視覺品質、增強文字渲染準確度,以及大幅降低過濾器封鎖率。
Google 表示,這項功能能協助開發者在多元應用場景中快速生成高品質圖像,特別適用於電商設計、內容創作、產品展示與 UI 試作等領域。實際應用包括:將商品圖片置換至不同背景情境實現情境式行銷、在 AI Studio 上進行即時協作繪圖、使用自然語言指定修改區域進行局部編輯、結合文字與圖像自動生成新商品 SKU 與包裝設計提案,以及作為創意夥伴協助用戶發想視覺與內容組合。
Google 已提供完整 API 串接方式,開發者可參考範例進行整合測試。目前圖像生成功能預覽版已全面開放,Google 也預告未來將持續提升模型品質、拓展功能並開放更高頻率的使用限制。