Computex 2026|最強大腦 NVIDIA Cosmos 3 發佈!機械人擁有「物理靈魂」現場示範自動駕駛車「自言自語」邊揸邊推理

| 李兆城 | 01-06-2026 14:55 |
Computex 2026|最強大腦 NVIDIA Cosmos 3 發佈!機械人擁有「物理靈魂」現場示範自動駕駛車「自言自語」邊揸邊推理

AI 生成圖片、寫文章、回答問題,這些應用在日常生活中早已屢見不鮮。然而,NVIDIA 行政總裁黃仁勳(Jensen Huang)在今日的 GTC Taipei 2026 主題演講中,將目光投向了更廣闊的領域,講述如何讓 AI 走出螢幕,進入現實世界,學會理解物理法則並自主運作。Physical AI 即是機械人、自動駕駛車、工廠設備甚至人形機器人,都能像人類一樣感知、思考與行動。雖然聽起來極具科幻感,但今日宣佈的三大進展,預示著這項技術距離日常生活,比想像中還要接近。

要理解這場變革,必須先釐清 Physical AI 與一般生成式 AI 的本質區別。日常使用的 ChatGPT 或 Midjourney 屬於語言或生成 AI,在數字世界中運作,處理並輸出文字與圖片。但當機械人試圖拿起一隻水杯時,它必須即時理解空間距離、物件重量、手指施力以及如何防止液體打翻。這些物理世界的知識無法單靠文字數據傳授,這也構成了 Physical AI 最大的數據瓶頸。黃仁勳在演講中指出:「語言模型用的數據,是人類從人類視角寫下來的文字;但機器人所需的數據,必須是機器人視角的第一身感知。問題是,世界上幾乎所有影片都是第三身拍攝的。」為了解決數據斷層,NVIDIA 推出全新 Cosmos 3 模型。

混合架構理解真實世界 全面降低本地產業微調門檻

Cosmos 3 是一個開放式的 Physical AI 基礎模型,採用全新的「混合 Transformer」架構,能夠同時處理像素、動作、聲音和語言四種輸入,堪稱理解物理世界的「最強大腦」。Cosmos 3 主要扮演四種核心角色:作為視覺語言模型(VLM)即時看懂並描述現實場景;作為世界生成模型,根據文字或圖片生成符合物理法則的合成影片;作為模擬器在閉環環境中為機械人提供虛擬訓練;以及作為動作預測模型,擔當機械人的實時決策引擎。

NVIDIA 更把 Cosmos 3 開源,連同訓練數據和訓練方式都一併公開,讓全球企業與研究機構能夠在此基礎上,微調出專屬的 Physical AI 模型。黃仁勳強調:「我們的做法和 Nemotron 一模一樣,開放模型、開放數據、開放訓練方式。」對於正在轉型的製造業、物流業及醫療機構而言,無需耗費巨資從零開始訓練 AI,只需針對自身特定的應用場景進行微調,便能大幅降低部署智能機械人的成本與技術門檻。

全球首款具備推理能力車載系統 自動駕駛實時自言自語

除了機械人腦袋的進化,自動駕駛領域亦迎來突破性進展。大會上發佈的 Alpamayo 2 是 NVIDIA 為自動駕駛車打造的開放 AI 模型,定位為「全球首款具備推理能力的自動駕駛系統」。在黃仁勳展示的實際行駛影片中,車輛在繁忙的城市街道上穿梭,AI 系統在後台不斷以語言「自言自語」作實時推理解析:「前方行人在我們的行車線上,減速讓路。」「左邊有車切線,向右微調。」「前方停車牌,交叉路口有橫向車流,停車。」

這種運作模式展示 AI 並非單純執行死板的代碼指令,而是如同人類駕駛者一樣,在實時推理每一個決策背後的因果關係。黃仁勳更笑言:「如果讓它一直說話,你會被它煩死。但它一直在自言自語,就是在思考。」當然,在實際駕駛時,它並不會說任何話!目前,Alpamayo 2 搭配 NVIDIA DRIVE Hyperion 車載平台,已吸引全球約 80% 汽車產量的製造商加入生態圈,並有約 97% 的全球出行服務接入合作。不久的將來,在出行乘坐網約車等,背後都可能跑著這款具備推理能力的引擎。

人形機器人參考平台平民化 學術研究前期準備縮短至數小時

Physical AI 的終極形態,最終落實於人形機器人身上。NVIDIA 為此對 Isaac GR00T 平台進行了全面更新。GR00T 作為一套完整的人形機器人開發技術棧,涵蓋遠程示範操作、Omniverse 模擬、Cosmos 數據生成、策略訓練以及基於 Jetson Orin 的實時部署系統,其模組化設計允許各個部分獨立替换,極具靈活性。緊接其後的是具象徵意義的實體產品 NVIDIA Isaac 人形機器人參考設計平台正式推出。

由 Unitree 製造的 H2 Plus 實體機器人身高六呎、重 150 磅,全身上下擁有 31 個自由度,每隻手掌另具備 22 個自由度,並搭載最新 Thor 機器人電腦及完整 NVIDIA 軟件棧。此平台主要面向全球高校及大學研究機構開放。黃仁勳解釋其初衷時表示:「每個研究團隊現在都要從頭開始搭建一切——模擬器、數據管道、訓練基礎設施,光是前期準備就要幾個月。我們希望讓他們幾小時內就可以開始真正的研究。」

走入有形機器的運算浪潮 悄然改變未來的科技生活

黃仁勳預告:「在農業設備、製造設備、重工業設備、基站、衛星……一切都會變成 Agentic。甚至你身邊,也會有一個小型 AI 助手。」Physical AI 的未來是,將原本只存在於雲端數據中心的龐大算力,徹底嵌入每一件移動的、有形的機器之中。不論是工廠的機械臂、物流倉庫的搬運機器人,還是穿梭在街道上的自動駕駛車,都將擁有獨立思考與適應物理世界的能力。

Source:ezone.hk、NVIDIA

相關文章

Page 1 of 9