OpenAI全新o3及o4-mini模型取代舊版被譽為「接近天才」實現「圖像思維」

| Fung Chun Man | 18-04-2025 19:46 |

在Google
追蹤《e-zone》

OpenAI推出全新AI模型o3及o4-mini，首度整合網頁瀏覽、編程、視覺分析及圖像生成等多項ChatGPT工具，實現更強大的模擬推理及多模態能力。這兩款新模型將取代舊有版本，ChatGPT Plus等用戶可率先試用，開發者亦可透過API存取，預料將為AI應用帶來顯著提升。

即刻【按此】，用 App 睇更多產品開箱影片

OpenAI推出全新AI模型o3及o4-mini 具備更強推理及多模態能力

美國人工智能研究公司OpenAI周三宣佈推出兩款全新的AI模型，分別為o3及o4-mini。這兩款模型結合了模擬推理能力，並能同時使用包括網頁瀏覽、編程、視覺分析及圖像生成等多項ChatGPT工具。OpenAI表示，這是其首批能全面整合所有ChatGPT工具的推理模型。

據悉，o3早於去年12月已公佈，但此前僅有功能較弱的衍生版本o3-mini及o3-mini-high供用戶使用。是次推出的新模型將取代原有的o1及o3-mini。OpenAI行政總裁Sam Altman在社交平台透露，預計將於數周內向Pro用戶開放更強大的o3-pro版本。

ChatGPT用家率先試用開發者亦可透過API存取

OpenAI宣佈，ChatGPT Plus、Pro及Team用戶今日起即可使用o3及o4-mini，而企業及教育機構用戶則將於下周獲得存取權限。免費版用戶亦可透過在提交查詢前選擇「Think」選項，試用o4-mini。至於開發者方面，兩款模型今日起已可透過Chat Completions API及Responses API使用，惟部分機構或需通過驗證。

OpenAI在其官方網站上聲稱，這些是他們迄今為止發佈的最智能模型，代表ChatGPT在能力上實現了顯著的飛躍，適用於從一般用戶到資深研究人員。公司又指，新模型比其前身更具成本效益，並且各有不同的應用場景：o3主要針對複雜分析，而作為其下一代SR模型o4（尚未發佈）的較小版本，o4-mini則更注重速度和成本效益。

突破性「圖像思維」能力模型可理解模糊圖像

值得注意的是，o3及o4-mini均具備多模態能力，能夠「以圖像思考」。這意味著模型不僅能分析視覺輸入，更能主動地「思考」圖像內容。這項功能使其能夠理解白板、教科書圖表及手繪草圖，即使圖像模糊或質量較低亦然。

OpenAI強調，這些新模型與其其他模型（如GPT-4o及GPT-4.5）的不同之處在於其模擬推理能力，透過模擬逐步「思考」的過程來解決問題。此外，新模型還能動態決定何時以及如何部署輔助工具來解決多步驟問題。舉例而言，當被問及加州未來的能源使用情況時，模型可以自主搜尋公用事業數據，編寫Python代碼以建立預測模型，生成可視化圖表，並解釋預測背後的關鍵因素，所有這些都在單一查詢中完成。

早期測試表現獲肯定專家稱o3具備「接近天才」水平

雖然OpenAI為其產品命名的方式持續引發混淆，例如功能更強大的o3的數字反而較o4-mini小，但早期用戶的反饋似乎相當正面。人工智能評論員及沃頓商學院教授Ethan Mollick在社交平台發文，認為o3與Google的Gemini 2.5 Pro處於相似的水平。

OpenAI總裁Greg Brockman在發佈會上更聲稱：「這些是首批頂尖科學家告訴我們，它們能產生真正優秀且有用的新穎想法的模型。」免疫學家Dr. Derya Unutmaz亦在社交平台表示，o3看來已達到或接近天才水平，並指其能根據需求生成複雜且具洞察力的科學假設。

基準測試數據亮眼惟獨立驗證仍待進行

OpenAI提供的基準測試數據顯示，o3在困難任務上的主要錯誤比o1減少20%，在編程、商業諮詢及創意構思方面表現尤為出色。o4-mini在美國數學邀請賽（AIME）2025中更取得了92.7%的準確率。在編程任務方面，o3在SWE-Bench Verified基準測試中達到69.1%的準確率。

然而，這些基準測試結果缺乏獨立驗證。獨立AI研究實驗室Transluce對早期版本的o3進行的評估發現，該模型存在重複性的虛構資訊問題。Transluce認為，這可能是由於模型無法存取先前對話中的推理過程所致。因此，專家建議，對於依賴SR模型進行嚴謹研究的人員，應仔細驗證AI模型的結果是否準確。

API定價具競爭力 OpenAI同時推出Codex CLI

對於ChatGPT訂閱用戶，使用o3及o4-mini已包含在訂閱費用中。在API方面，o3的定價為每百萬輸入token 10美元，每百萬輸出token 40美元，緩存輸入的折扣價為每百萬token 2.5美元，較o1的定價大幅降低。o4-mini的定價則與其前身o3-mini相同，為每百萬輸入token 1.1美元，每百萬輸出token 4.4美元，緩存輸入為每百萬token 0.275美元。

與此同時，OpenAI還推出了一款實驗性終端應用程式Codex CLI，形容為「一個可從終端運行的輕量級編程代理」。這款開源工具可將模型連接到用戶的電腦及本地代碼。OpenAI亦宣佈設立100萬美元的資助計劃，為使用Codex CLI的項目提供API額度。

【相關報道】

Source：TechCrunch.com

科技

Page 1 of 9

在Google
追蹤《e-zone》

OpenAI全新o3及o4-mini模型取代舊版被譽為「接近天才」實現「圖像思維」

| Fung Chun Man | 18-04-2025 19:46 |

在Google
追蹤《e-zone》

OpenAI推出全新AI模型o3及o4-mini 具備更強推理及多模態能力

ChatGPT用家率先試用開發者亦可透過API存取

突破性「圖像思維」能力模型可理解模糊圖像

早期測試表現獲肯定專家稱o3具備「接近天才」水平

基準測試數據亮眼惟獨立驗證仍待進行

API定價具競爭力 OpenAI同時推出Codex CLI

科技

相關文章

科技焦點

網絡生活

遊戲動漫

教學評測

IT Times

其他

OpenAI全新o3及o4-mini模型取代舊版 被譽為「接近天才」實現「圖像思維」

| Fung Chun Man | 18-04-2025 19:46 | 在Google追蹤《e-zone》

OpenAI推出全新AI模型o3及o4-mini 具備更強推理及多模態能力

ChatGPT用家率先試用 開發者亦可透過API存取

突破性「圖像思維」能力 模型可理解模糊圖像

早期測試表現獲肯定 專家稱o3具備「接近天才」水平

基準測試數據亮眼 惟獨立驗證仍待進行

API定價具競爭力 OpenAI同時推出Codex CLI

科技

相關文章

【最強Vlog相機攻略】拍Vlog用什麼相機？Insta360、SONY、DJI推薦6款+選購要點

iPhone狂彈容量不足？3招清iPhone容量零成本塞100萬張相 免刪相無痛卸載App保留資料

港女必備！《男友照相機》爆紅 AI 構圖從此告別「影到我肥」的世紀爭拗【附免費使用連結】

【方保僑 - 天方夜談】AI天氣預測應對超級厄爾尼諾

OpenAI全新o3及o4-mini模型取代舊版被譽為「接近天才」實現「圖像思維」

| Fung Chun Man | 18-04-2025 19:46 |

在Google
追蹤《e-zone》

ChatGPT用家率先試用開發者亦可透過API存取

突破性「圖像思維」能力模型可理解模糊圖像

早期測試表現獲肯定專家稱o3具備「接近天才」水平

基準測試數據亮眼惟獨立驗證仍待進行

iPhone狂彈容量不足？3招清iPhone容量零成本塞100萬張相免刪相無痛卸載App保留資料