
Elon Musk 旗下的科技旗艦 xAI 再次震撼市場,宣佈正式推出 Grok 4.20 Beta 版本。這次更新並非單純的參數疊加,而是將 AI 的運作邏輯提升至全新層次。過往我們與 ChatGPT 或 Claude 等模型對話,就像是在跟一個博學但偶爾會「老點」用戶的專家對談;但 Grok 4.20 卻引入了革命性的「多代理系統」(Multi-agent system),簡單來說,就是讓 AI 懂得「圍爐開會」。
這個系統不再是由單一模型運作,而是由四個各司其職的專業 AI 代理組成,它們分別被命名為 Grok、Harper、Benjamin 及 Lucas。當用戶提出一個複雜指令時,這四個 Agent 會在後台進行並行思考與實時辯論。這種「眾議院」式的機制,要求各代理在給出最終答案前先互相挑剔、核實事實,最終達成共識才輸出給用戶,令答案的深度與嚴謹性大幅提升。
這種「多代理協作」機制,核心目標是為了解決生成式 AI 長期以來的「幻覺」(Hallucination)問題。以往 AI 為了完成對話,往往會生造事實,但在 Grok 4.20 的架構下,如果一個代理給出了錯誤資訊,另外三個代理會在辯論階段即時糾正。這種機制令輸出內容更趨理性,特別是在處理高風險的科研數據或編程邏輯時,能有效過濾掉不實的「講大話」內容。
在技術指標方面,Grok 4.20 的表現同樣驚人。根據 LMArena 的預估 Elo 分數顯示,該模型目前處於 1505 至 1535 的區間。要理解這個數字的含金量,可以參考目前的 Grok 4.1,其分數已達 1483;而新系統透過多代理的「推理時間運算」(Inference-time compute),預計能增加 20 至 60 分。一旦正式排名確認,極有可能超越現有對手,問鼎全球最強 AI 寶座。
除了實驗室的 Benchmark 數據,Grok 4.20 在現實世界的實戰能力更令業界側目。在 Alpha Arena 的實時股票交易比賽中,當大部份競爭對手都錄得虧損時,Grok 4.20 竟然創下了 +34.59% 的驚人投資回報。這證明了其四代理系統在處理複雜、動態的金融數據時,具備極強的預測與決策能力,而非單純的文字拼湊。
為了支撐如此龐大的運算需求,xAI 動用了著名的 Colossus 超級電腦集群進行訓練,該集群配備了多達 200,000 顆 GPU。硬件上的強大支持,令 Grok 4.20 的文本窗口(Context Window)由基礎的 256K,最高可擴展至驚人的 2M。這意味著用戶可以一次過將數百萬字的技術說明書、甚至長達數小時的影片餵給 AI,它依然能清晰記住每一個細節,唔會出現「失憶」情況。
作為一款原生多模態模型,Grok 4.20 具備同時處理及生成文字、圖像及影片的能力。由於其底層架構經過深度優化,處理多媒體資訊的速度極快,且能保持高度的一致性。Beta 版用戶的初步回饋顯示,其收斂高品質答案的速度遠超前代,對於需要長期處理海量資料的科研人員或開發者而言,絕對是效率神器。
Source:nextbigfuture