Google DeepMind 近日在開發者大會上發表兩項創新技術:「Gemini Diffusion」與 Gemini 2.5 Pro 的「Deep Think 模式」,這兩項技術將大幅提升 AI 在數學與程式設計領域的推理與生成能力,為 Gemini 模型家族帶來重要進化。
Gemini Diffusion 採用全新的生成機制,不同於傳統語言模型直接預測文字的方式,而是運用「擴散模型(Diffusion Model)」技術,通過將雜訊逐步精煉為答案的過程,類似圖像生成中的逐步還原程序。這種方法使模型在處理數學問題與程式碼等邏輯密集型任務時,能進行多次推敲與修正,從而提高解題效率與準確性。目前 Gemini Diffusion 已開放實驗性展示版本,並接受使用者登記候補名單,以收集回饋優化未來版本。
另一項重要功能是 Gemini 2.5 Pro 搭載的「Deep Think」推理模式。該模式整合了 DeepMind 團隊最新研發的「平行思考技術(Parallel Thinking)」,能在生成回答前同時考量多種可能假設,再從中歸納出最具邏輯依據的回應。在 2025 年美國數學奧林匹亞競賽(USAMO)測評中,Deep Think 模式已展現出優異表現,同時在 LiveCodeBench 與 MMMU 等高難度評測中也名列前茅。
Google DeepMind 表示,未來幾週將通過 Gemini API 向安全團隊與特定開發者開放測試,以獲取更多實際應用的回饋。這些技術未來可能對 AI 教學、程式生成與研究工具領域帶來深遠影響。