Google 最新推出的 Gemini 3 人工智能模型展現出驚人的數學推理能力,引發學術界和科技圈的廣泛關注。根據最新測試結果,這款 AI 不僅在多項標準評測中領先,更在實際應用中證明了其解決複雜數學問題的能力。
研究機構 EpochAI 發布的數據顯示,Gemini 3 Pro 在 FrontierMath 基準測試中創下新紀錄,在 Tier 1-3 類別中達到 38% 的準確率,Tier 4 類別也達到 19%。在綜合能力評估的 Epoch 能力指標(ECI)中,Gemini 3 獲得 154 分,超越了 GPT-5.1 之前保持的 151 分記錄。
FrontierMath 是由專業數學家共同設計的評測系統,專門用於測試 AI 的高階數學推理能力,被視為當前最具挑戰性的 AI 數學評測工具。其題庫涵蓋代數幾何、範疇論、數論和實分析等現代數學領域,難度接近研究級水平。
更令人印象深刻的是,著名數學家陶哲軒親自驗證了 Gemini 3 的能力。他在社群平台分享,使用 Gemini Deepthink 模式處理埃爾德什問題 #367 時,AI 僅用約十分鐘就提供了完整且可驗證的推導框架。這一成果隨後經過重寫和正式驗證,充分展示了 AI 在協助處理複雜數學問題方面的潛力。
除了數學領域,Gemini 3 在物理學研究中也表現出色。在新推出的 CritPt 物理基準測試中,Gemini 3 Pro 以 9.1% 的整體表現領先其他模型,雖然這一數字表明研究級物理推理仍是 AI 發展的下一個重要挑戰。
隨著 AI 能力的不斷提升,頂尖研究者已開始將這些模型視為研究夥伴,預示著數學與科學研究的合作模式可能迎來重大變革。未來,能夠有效與高階 AI 模型協作的研究者將在研究效率方面獲得顯著優勢。
Copyright © 2022~2026 好好聽文創傳媒股份有限公司 All Rights Reserved.