OpenAI推出全新AI模型o3及o4-mini,首度整合網頁瀏覽、編程、視覺分析及圖像生成等多項ChatGPT工具,實現更強大的模擬推理及多模態能力。這兩款新模型將取代舊有版本,ChatGPT Plus等用戶可率先試用,開發者亦可透過API存取,預料將為AI應用帶來顯著提升。
即刻【按此】,用 App 睇更多產品開箱影片
美國人工智能研究公司OpenAI周三宣佈推出兩款全新的AI模型,分別為o3及o4-mini。這兩款模型結合了模擬推理能力,並能同時使用包括網頁瀏覽、編程、視覺分析及圖像生成等多項ChatGPT工具。OpenAI表示,這是其首批能全面整合所有ChatGPT工具的推理模型。
據悉,o3早於去年12月已公佈,但此前僅有功能較弱的衍生版本o3-mini及o3-mini-high供用戶使用。是次推出的新模型將取代原有的o1及o3-mini。OpenAI行政總裁Sam Altman在社交平台透露,預計將於數周內向Pro用戶開放更強大的o3-pro版本。
OpenAI宣佈,ChatGPT Plus、Pro及Team用戶今日起即可使用o3及o4-mini,而企業及教育機構用戶則將於下周獲得存取權限。免費版用戶亦可透過在提交查詢前選擇「Think」選項,試用o4-mini。至於開發者方面,兩款模型今日起已可透過Chat Completions API及Responses API使用,惟部分機構或需通過驗證。
OpenAI在其官方網站上聲稱,這些是他們迄今為止發佈的最智能模型,代表ChatGPT在能力上實現了顯著的飛躍,適用於從一般用戶到資深研究人員。公司又指,新模型比其前身更具成本效益,並且各有不同的應用場景:o3主要針對複雜分析,而作為其下一代SR模型o4(尚未發佈)的較小版本,o4-mini則更注重速度和成本效益。
值得注意的是,o3及o4-mini均具備多模態能力,能夠「以圖像思考」。這意味著模型不僅能分析視覺輸入,更能主動地「思考」圖像內容。這項功能使其能夠理解白板、教科書圖表及手繪草圖,即使圖像模糊或質量較低亦然。
OpenAI強調,這些新模型與其其他模型(如GPT-4o及GPT-4.5)的不同之處在於其模擬推理能力,透過模擬逐步「思考」的過程來解決問題。此外,新模型還能動態決定何時以及如何部署輔助工具來解決多步驟問題。舉例而言,當被問及加州未來的能源使用情況時,模型可以自主搜尋公用事業數據,編寫Python代碼以建立預測模型,生成可視化圖表,並解釋預測背後的關鍵因素,所有這些都在單一查詢中完成。
雖然OpenAI為其產品命名的方式持續引發混淆,例如功能更強大的o3的數字反而較o4-mini小,但早期用戶的反饋似乎相當正面。人工智能評論員及沃頓商學院教授Ethan Mollick在社交平台發文,認為o3與Google的Gemini 2.5 Pro處於相似的水平。
OpenAI總裁Greg Brockman在發佈會上更聲稱:「這些是首批頂尖科學家告訴我們,它們能產生真正優秀且有用的新穎想法的模型。」免疫學家Dr. Derya Unutmaz亦在社交平台表示,o3看來已達到或接近天才水平,並指其能根據需求生成複雜且具洞察力的科學假設。
OpenAI提供的基準測試數據顯示,o3在困難任務上的主要錯誤比o1減少20%,在編程、商業諮詢及創意構思方面表現尤為出色。o4-mini在美國數學邀請賽(AIME)2025中更取得了92.7%的準確率。在編程任務方面,o3在SWE-Bench Verified基準測試中達到69.1%的準確率。
然而,這些基準測試結果缺乏獨立驗證。獨立AI研究實驗室Transluce對早期版本的o3進行的評估發現,該模型存在重複性的虛構資訊問題。Transluce認為,這可能是由於模型無法存取先前對話中的推理過程所致。因此,專家建議,對於依賴SR模型進行嚴謹研究的人員,應仔細驗證AI模型的結果是否準確。
對於ChatGPT訂閱用戶,使用o3及o4-mini已包含在訂閱費用中。在API方面,o3的定價為每百萬輸入token 10美元,每百萬輸出token 40美元,緩存輸入的折扣價為每百萬token 2.5美元,較o1的定價大幅降低。o4-mini的定價則與其前身o3-mini相同,為每百萬輸入token 1.1美元,每百萬輸出token 4.4美元,緩存輸入為每百萬token 0.275美元。
與此同時,OpenAI還推出了一款實驗性終端應用程式Codex CLI,形容為「一個可從終端運行的輕量級編程代理」。這款開源工具可將模型連接到用戶的電腦及本地代碼。OpenAI亦宣佈設立100萬美元的資助計劃,為使用Codex CLI的項目提供API額度。
【相關報道】
Source:TechCrunch.com