OpenAI於12日正式推出全新一代大型語言模型GPT-5.2,該模型專為提升專業知識工作、長任務代理處理與複雜專案管理能力而設計。根據OpenAI聲明,GPT-5.2是目前該公司最強大的模型系列,分為Instant、Thinking與Pro三種版本,將優先向ChatGPT付費用戶開放使用,同時已在API平台全面上線。
GPT-5.2的核心目標是協助專業人士提高工作效率,涵蓋範圍從試算表製作、簡報設計、程式碼撰寫,到影像解析、長文件理解、工具運用與多步驟任務執行。官方數據顯示,一般企業用戶平均每天可節省40至60分鐘,重度使用者甚至能減少每週10小時以上的工作時間。
在專業評測方面,GPT-5.2 Thinking版本創下多項新紀錄:GDPval知識工作評測中,在44種職業任務測試中有70.9%達到與產業專家平手或勝出的水準,首次達成「整體專家級表現」;程式能力方面,在SWE-BenchPro實際軟體工程測試中達到55.6%正確率,SWE-benchVerified (Python)提升至80%;高難度數學FrontierMath (Tier1-3)提升至40.3%,而在AIME2025競賽數學中更達到罕見的100%完美表現。
長上下文推理能力是GPT-5.2的另一大突破,在OpenAI MRCRv2測試中,模型於256k tokens的4-needle任務中接近100%準確率,特別是在128k至256k範圍內仍保持高度穩定性,意味著能更可靠地處理大量文字的合約、研究論文與大型專案文件。
視覺理解方面,GPT-5.2 Thinking在科學圖表辨識(CharXiv)中的錯誤率約減半,在專業介面理解(ScreenSpot-Pro)更大幅領先前代,使其更適合應用於金融、營運、工程與設計等高度依賴視覺資訊的領域。工具調用能力也刷新紀錄,在τ2-benchTelecom多輪任務中成功率達98.7%,能更完整處理跨步驟流程。
API定價方面,GPT-5.2基本版每百萬字元輸入收費1.75美元、輸出14美元,Pro版則為每百萬字元輸入21美元、輸出168美元。OpenAI表示,雖然GPT-5.2單位成本較高,但由於模型在推理效率與生成品質上更精準,實際完成同等品質任務的總成本可能反而降低。
GPT-5.2提供三個版本:Instant適合快速處理大多數日常任務;Thinking適合深度推理、文件分析、程式碼與大專案;Pro則是最強
Copyright © 2022~2026 好好聽文創傳媒股份有限公司 All Rights Reserved.