• Facebook
  • Instagram
  • 科技焦點
    • iPhone
    • 電腦
    • 智能家居
    • 5G流動
    • 數碼
    • 科技
    • 汽車
    • 人工智能
  • 網絡生活
    • 網絡熱話
    • 筍買情報
    • 生活情報
    • 旅遊筍料
    • 熱門話題
  • 遊戲動漫
    • 熱門遊戲
    • 電競裝備
    • 動漫玩具
  • 教學評測
    • 應用秘技
    • 新品測試
    • Apps 情報
  • EduTech
    • EduTech Today
    • EduTech Pro
    • EduTech@School
  • IT Times
    • 業界頭條
    • AI 策略
    • 名家專欄
  • 生成式AI與雲端應用
  • Enterprise Digital Transformation
  • 特集
  • 科技焦點
    • 科技焦點

    • iPhone
    • 電腦
    • 智能家居
    • 5G流動
    • 數碼
    • 科技
    • 汽車
    • 人工智能
  • 網絡生活
    • 網絡生活

    • 網絡熱話
    • 筍買情報
    • 生活情報
    • 旅遊筍料
    • 熱門話題
  • 遊戲動漫
    • 遊戲動漫

    • 熱門遊戲
    • 電競裝備
    • 動漫玩具
  • 教學評測
    • 教學評測

    • 應用秘技
    • 新品測試
    • Apps 情報
  • EduTech
    • EduTech

    • EduTech Today
    • EduTech Pro
    • EduTech@School
  • IT Times
    • IT Times

    • 業界頭條
    • AI 策略
    • 名家專欄
  • 生成式AI與雲端應用
  • Enterprise Digital Transformation
  • 特集

OpenAI全新o3及o4-mini模型取代舊版 被譽為「接近天才」實現「圖像思維」

| Fung Chun Man | 18-04-2025 19:46 |
OpenAI全新o3及o4-mini模型取代舊版 被譽為「接近天才」實現「圖像思維」

OpenAI推出全新AI模型o3及o4-mini,首度整合網頁瀏覽、編程、視覺分析及圖像生成等多項ChatGPT工具,實現更強大的模擬推理及多模態能力。這兩款新模型將取代舊有版本,ChatGPT Plus等用戶可率先試用,開發者亦可透過API存取,預料將為AI應用帶來顯著提升。

即刻【按此】,用 App 睇更多產品開箱影片

OpenAI推出全新AI模型o3及o4-mini 具備更強推理及多模態能力

美國人工智能研究公司OpenAI周三宣佈推出兩款全新的AI模型,分別為o3及o4-mini。這兩款模型結合了模擬推理能力,並能同時使用包括網頁瀏覽、編程、視覺分析及圖像生成等多項ChatGPT工具。OpenAI表示,這是其首批能全面整合所有ChatGPT工具的推理模型。

據悉,o3早於去年12月已公佈,但此前僅有功能較弱的衍生版本o3-mini及o3-mini-high供用戶使用。是次推出的新模型將取代原有的o1及o3-mini。OpenAI行政總裁Sam Altman在社交平台透露,預計將於數周內向Pro用戶開放更強大的o3-pro版本。

OpenAI全新o3及o4-mini模型取代舊版 被譽為「接近天才」實現「圖像思維」
API定價具競爭力 OpenAI同時推出Codex CLI對於ChatGPT訂閱用戶,使用o3及o4-mini已包含在訂閱費用中

ChatGPT用家率先試用 開發者亦可透過API存取

OpenAI宣佈,ChatGPT Plus、Pro及Team用戶今日起即可使用o3及o4-mini,而企業及教育機構用戶則將於下周獲得存取權限。免費版用戶亦可透過在提交查詢前選擇「Think」選項,試用o4-mini。至於開發者方面,兩款模型今日起已可透過Chat Completions API及Responses API使用,惟部分機構或需通過驗證。

OpenAI在其官方網站上聲稱,這些是他們迄今為止發佈的最智能模型,代表ChatGPT在能力上實現了顯著的飛躍,適用於從一般用戶到資深研究人員。公司又指,新模型比其前身更具成本效益,並且各有不同的應用場景:o3主要針對複雜分析,而作為其下一代SR模型o4(尚未發佈)的較小版本,o4-mini則更注重速度和成本效益。

OpenAI全新o3及o4-mini模型取代舊版 被譽為「接近天才」實現「圖像思維」
API定價具競爭力 OpenAI同時推出Codex CLI對於ChatGPT訂閱用戶,使用o3及o4-mini已包含在訂閱費用中

突破性「圖像思維」能力 模型可理解模糊圖像

值得注意的是,o3及o4-mini均具備多模態能力,能夠「以圖像思考」。這意味著模型不僅能分析視覺輸入,更能主動地「思考」圖像內容。這項功能使其能夠理解白板、教科書圖表及手繪草圖,即使圖像模糊或質量較低亦然。

OpenAI強調,這些新模型與其其他模型(如GPT-4o及GPT-4.5)的不同之處在於其模擬推理能力,透過模擬逐步「思考」的過程來解決問題。此外,新模型還能動態決定何時以及如何部署輔助工具來解決多步驟問題。舉例而言,當被問及加州未來的能源使用情況時,模型可以自主搜尋公用事業數據,編寫Python代碼以建立預測模型,生成可視化圖表,並解釋預測背後的關鍵因素,所有這些都在單一查詢中完成。

OpenAI全新o3及o4-mini模型取代舊版 被譽為「接近天才」實現「圖像思維」
雖然OpenAI為其產品命名的方式持續引發混淆,例如功能更強大的o3的數字反而較o4-mini小,但早期用戶的反饋似乎相當正面。

早期測試表現獲肯定 專家稱o3具備「接近天才」水平

雖然OpenAI為其產品命名的方式持續引發混淆,例如功能更強大的o3的數字反而較o4-mini小,但早期用戶的反饋似乎相當正面。人工智能評論員及沃頓商學院教授Ethan Mollick在社交平台發文,認為o3與Google的Gemini 2.5 Pro處於相似的水平。

OpenAI總裁Greg Brockman在發佈會上更聲稱:「這些是首批頂尖科學家告訴我們,它們能產生真正優秀且有用的新穎想法的模型。」免疫學家Dr. Derya Unutmaz亦在社交平台表示,o3看來已達到或接近天才水平,並指其能根據需求生成複雜且具洞察力的科學假設。

OpenAI全新o3及o4-mini模型取代舊版 被譽為「接近天才」實現「圖像思維」
值得注意的是,o3及o4-mini均具備多模態能力,能夠「以圖像思考」。

基準測試數據亮眼 惟獨立驗證仍待進行

OpenAI提供的基準測試數據顯示,o3在困難任務上的主要錯誤比o1減少20%,在編程、商業諮詢及創意構思方面表現尤為出色。o4-mini在美國數學邀請賽(AIME)2025中更取得了92.7%的準確率。在編程任務方面,o3在SWE-Bench Verified基準測試中達到69.1%的準確率。

然而,這些基準測試結果缺乏獨立驗證。獨立AI研究實驗室Transluce對早期版本的o3進行的評估發現,該模型存在重複性的虛構資訊問題。Transluce認為,這可能是由於模型無法存取先前對話中的推理過程所致。因此,專家建議,對於依賴SR模型進行嚴謹研究的人員,應仔細驗證AI模型的結果是否準確。

OpenAI全新o3及o4-mini模型取代舊版 被譽為「接近天才」實現「圖像思維」
OpenAI還推出了一款實驗性終端應用程式Codex CLI,形容為「一個可從終端運行的輕量級編程代理」。

API定價具競爭力 OpenAI同時推出Codex CLI

對於ChatGPT訂閱用戶,使用o3及o4-mini已包含在訂閱費用中。在API方面,o3的定價為每百萬輸入token 10美元,每百萬輸出token 40美元,緩存輸入的折扣價為每百萬token 2.5美元,較o1的定價大幅降低。o4-mini的定價則與其前身o3-mini相同,為每百萬輸入token 1.1美元,每百萬輸出token 4.4美元,緩存輸入為每百萬token 0.275美元。

與此同時,OpenAI還推出了一款實驗性終端應用程式Codex CLI,形容為「一個可從終端運行的輕量級編程代理」。這款開源工具可將模型連接到用戶的電腦及本地代碼。OpenAI亦宣佈設立100萬美元的資助計劃,為使用Codex CLI的項目提供API額度。

OpenAI全新o3及o4-mini模型取代舊版 被譽為「接近天才」實現「圖像思維」
OpenAI推出全新AI模型o3及o4-mini 具備更強推理及多模態能力

【相關報道】

  • OpenAI擬打造自家社交平台 直接挑戰Facebook及X
  • OpenAI擬推機構實名驗證 或為防止經API非法獲取數據訓練模型
  • Jony Ive、Sam Altman 合組 AI 硬件初創傳被 OpenAI 收購 最新 Project 設計 AI 智能手機
  • OpenAI o1、DeepSeek R1 應考東京大學入學考試 足夠合格尤其英語最強
  • OpenAI Sora實試|顛覆影片製作模式!Sora AI影片生成技術 簡單文字即變影片

Source:TechCrunch.com

科技

相關文章

【AWS re:Invent 2025】AWS 3nm 自研晶片 Trainium 3 效能狂飆 4.4 倍 Nova 2 Omni 模型貫通圖文影音

AWS AI基礎設施全面升級|Trainium晶片與AI Factory 打造企業級算力新格局

Anthropic Claude 4.5 系列登陸 Amazon Bedrock 智能代理時代來臨 AI 表現再創新高

AWS re:Invent 2025|Matt Garman主題演講:AI重塑雲端技術未來

Page 1 of 9

科技焦點

  • iPhone
  • 5G流動
  • 電腦
  • 數碼
  • 智能家居
  • 科技
  • 汽車
  • 人工智能

網絡生活

  • 網絡熱話
  • 生活情報
  • 筍買着數
  • 旅遊筍料
  • 熱門話題
  •  
  •  

遊戲動漫

  • 熱門遊戲
  • 電競裝備
  • 動漫玩具

教學評測

  • 應用秘技
  • 新品測試
  • Apps 情報

IT Times

  • 業界頭條
  • AI 策略
  • 名家專欄

其他

  • 私隱政策
  • 免責聲明
  • 聯絡/關於我們

© 2025 e-zone. All Rights Reserved.