Gemini 3 創紀錄解決數學難題，陶哲軒驗證其卓越表現

2025-11-24 10:15 　　鉅聞天下｜撰稿編輯中心

Google 最新推出的 Gemini 3 人工智能模型展現出驚人的數學推理能力，引發學術界和科技圈的廣泛關注。根據最新測試結果，這款 AI 不僅在多項標準評測中領先，更在實際應用中證明了其解決複雜數學問題的能力。

研究機構 EpochAI 發布的數據顯示，Gemini 3 Pro 在 FrontierMath 基準測試中創下新紀錄，在 Tier 1-3 類別中達到 38% 的準確率，Tier 4 類別也達到 19%。在綜合能力評估的 Epoch 能力指標(ECI)中，Gemini 3 獲得 154 分，超越了 GPT-5.1 之前保持的 151 分記錄。

FrontierMath 是由專業數學家共同設計的評測系統，專門用於測試 AI 的高階數學推理能力，被視為當前最具挑戰性的 AI 數學評測工具。其題庫涵蓋代數幾何、範疇論、數論和實分析等現代數學領域，難度接近研究級水平。

更令人印象深刻的是，著名數學家陶哲軒親自驗證了 Gemini 3 的能力。他在社群平台分享，使用 Gemini Deepthink 模式處理埃爾德什問題 #367 時，AI 僅用約十分鐘就提供了完整且可驗證的推導框架。這一成果隨後經過重寫和正式驗證，充分展示了 AI 在協助處理複雜數學問題方面的潛力。

除了數學領域，Gemini 3 在物理學研究中也表現出色。在新推出的 CritPt 物理基準測試中，Gemini 3 Pro 以 9.1% 的整體表現領先其他模型，雖然這一數字表明研究級物理推理仍是 AI 發展的下一個重要挑戰。

隨著 AI 能力的不斷提升，頂尖研究者已開始將這些模型視為研究夥伴，預示著數學與科學研究的合作模式可能迎來重大變革。未來，能夠有效與高階 AI 模型協作的研究者將在研究效率方面獲得顯著優勢。

社群

Gemini 3 創紀錄解決數學難題，陶哲軒驗證其卓越表現

合作媒體

重要連結

社群

Gemini 3 創紀錄解決數學難題，陶哲軒驗證其卓越表現

相關新聞

也許您會感興趣

合作媒體

重要連結

社群