
GPT-5|人工智能巨頭OpenAI正式發布新一代模型GPT-5,並同步免費開放予所有ChatGPT用戶使用。新模型不僅在多項能力上大幅躍進,更一次過化繁為簡,整合以往多個模型成一個GPT-5,而文字、語音、圖像及影片等多模態處理能力亦有大幅提升。本文將整合你要了解的5大GPT-5升級重點!
Table of Contents
GPT-5|5大升級重點:編程能力大突破
GPT-5在多個評測中的分數表現出色,在編程能力上表現尤其亮眼。在模擬真實軟體工程任務的SWE-bench Verified測試中,GPT-5獲得 74.9%的分數,超越市面上的主流模型對手。
GPT-5|5大升級重點:強化自主代理能力
另外,GPT-5的重大突破是其「自主代理」能力。與過往需要用戶不斷指引的模型不同,GPT-5 能夠將高層次目標自動拆解為一系列具體子任務,並主動規劃和執行。用戶甚至可以指示它在遇到不確定性時,選擇「自行決定合理步驟,不要回問」。業界預計,這種從「被動應答」到「主動執行」的轉變,將大大提升用家工作效率。
GPT-5|5大升級重點:提升使用串連工具穩定性
此外,在極具挑戰的工具使用基準測試 τ²-bench telecom 中,GPT-5 取得了 97% 的分數。據了解,先前沒有任何模型得分超過 49%。這項測試的重點在於模型與一個狀態會隨時變動的環境互動的能力,結果證明 GPT-5 能夠相當穩定地串連多個工具,無論是依序或並行呼叫,都能準確完成任務。
GPT-5|5大升級重點:「幻覺」問題大為改善
大型語言模型長久以來備受詬病的「幻覺」問題,在GPT-5上也得到顯著抑制。OpenAI數據顯示,GPT-5在多項事實性基準測試中,產生的事實錯誤比前代模型減少了約 80%,使GPT-5處理需要高準確度的任務,如數據分析、法律文件草擬等,變得更值得信賴。
GPT-5|5大升級重點:引入全新「推理深度」API參數
最後,GPT-5為滿足不同開發者的需求,也引入了全新的API參數 「reasoning_effort」(推理深度)。現在,開發者可依據成本及效能,自由調整模型「思考」深度,無論是需要即時反應的簡單任務,還是需要深入分析研究的任務,都能找到平衡。值得一提的是,除了 GPT-5,今次OpenAI 亦推出GPT-5-mini、GPT-5-nano,相關價格下調之外,從直播示範中可見,模型生成速度有所提升。據悉,免費版用家雖然可以使用 GPT‑5,但有生成限額,一旦超過就會改為提供 GPT‑5‑mini。
即刻【按此】,用 App 睇更多產品開箱影片
【熱門報道】
Source:inside.com.tw、x@OpenAI
【相關話題】AI公司職場殘酷 9個月高薪補償抑或爆肝OT
AI公司 Cognition Labs 收購 Windsurf 後,隨即裁減部分員工,並向留任者提出嚴苛工作條件。這場充滿爭議的收購案,除了掀起裁員潮,更因其「無工作與生活平衡」的企業文化,引發業界對員工權益的關注。
Source:ezone.hk
【相關話題】Grok 4 登場!xAI 「地表最強」AI助手懶人包
LLM Grok 3 是由 Elon Musk 旗下 xAI 研發的最新一代生成式 AI 模型,被譽為「地表最強」的大型 AI 模型,效能上媲美甚至超越 OpenAI GPT-4、Google Gemini 及 DeepSeek 等,在理解上下文、產生連貫且富有洞察力的回應方面尤為出色。另亦附有最新 Grok 4 的詳細介紹。
Source:ezone.hk
