OpenAI正式推出「ChatGPT代理人(Agent)模式」,這項重大更新使ChatGPT從單純的對話工具轉變為能夠自主規劃、執行和完成複雜任務的智能助手。用戶只需提出任務目標,ChatGPT便能自動選擇最適合的工具組合,包括虛擬瀏覽器、API連接器、終端機與文件編輯器,來完成各種複雜工作,如「分析競爭對手並製作簡報」或「規劃與採購日式早餐」。
這項新功能已向Pro、Plus與Team用戶開放,Enterprise與教育版本將於未來數週內陸續推出。OpenAI表示,Agent模式整合了先前的Operator(網頁互動)與DeepResearch(深度分析)兩大系統,並結合虛擬電腦功能,使模型能在「思考與行動」間無縫切換。其創新之處在於ChatGPT不僅能閱讀與分析網路資訊,還能主動點擊、登入、運行程式、生成簡報或編輯表格,完成整個任務流程。
在安全性方面,OpenAI實施了多重防護機制。Agent模式必須經用戶授權後才會執行敏感操作,如登入帳號或處理資料,並設有「監督模式」和「高風險任務自拒」等保護措施。此外,OpenAI將此模型列為具高生物與化學風險能力的系統,啟動最高安全準則。
實測結果顯示,ChatGPT Agent在多項專業任務基準中表現超越人類與前代模型。在AI能力測試「人類的最後考試」中取得41.6%的全新SOTA成績,在FrontierMath、DSBench、BrowseComp、WebArena等基準上也創下領先紀錄。
OpenAI表示,這只是開始,未來將持續擴充Agent功能,包括更進階的簡報產出、支援定期任務排程,以及更多網站與應用程式的整合支援。