商湯日日新5.0大模型發布性能對標GPT-4 Turbo料3年內國產芯片提供一半算力

| Johannes | 24-04-2024 00:19 |

在Google
追蹤《e-zone》

中國人工智能企業商湯科技（Sense Time）於上海人工智能計算中心 (AIDC) 舉辦技術交流日，發布「日日新SenseNova 5.0」大模型體系。商湯科技董事長兼首席執行官徐立博士接受ezone.hk記者訪問，談及商湯在人工智能的發展，並即場演示大模型和一系列最新側端大模型的實際應用情況。

徐立表示，商湯日日新5.0大模型在知識、數學、推理及代碼能力，都相當接近或在高階推理方面超越GPT-4 Turbo。發布會現場更演示商湯日日新5.0的「秒畫 SenseMirage」文生圖功能，對比目前其他主流生成模型，如：Stable Difussion，Dall-E 和 MidJourney，記者現場所見「秒畫」圖片的人物和動物上的質感、紋理表現都較其他三者為佳，同時，亦更準確地掌握中文語言指令。

↓點擊圖片放大↓

此外，「商量SenseChat」千億級參數語言大模型也即場演示多個獨特場景下的應用情況，包括：大型數據分析、圖片內容識別等。徐立特別強調，「從感知到生成」的過程表現提升。目前，商湯人工智能大模型的算力基礎，主要由NVIDIA A800、H800和 GeForce RTX 4090D三款GPU推動，也投入了近 14 款國產芯片在超算中心的營運當中。在算力國產化上，商湯與華為等國內芯片商合作，目前做到800p的算力由國產芯片推動。

↓點擊圖片放大↓

商湯科技更推出「企業級大模型一體機」。針對金融、醫療、政務和代碼四大方面的AI應用而設，透過商湯設計的行業大模型更快更準確地為客戶提供相關服務。具體來說，它可同時支持企業級千億模型加速和知識檢索硬件加速，實現本地化部署，即買即用，每台售價35萬人民幣起，最多支援100人團隊使用，成本最低可達每天每人4.5元人民幣。相比同類產品，推理成本節約80%，CPU工作負載減少約50%。徐立也提到早前的OpenAI Sora文生影片模型引起極大關注，而商湯目前仍在這方面努力當中，但相信很快有好消息公布。

↓點擊圖片放大↓

會後，記者與徐立進行更深入的交流。對於開發較小型的模型原因，徐立回應指，ChatGPT和Meta的模型雖大而且具通用知識，但是沒有為特定行業所需而設計。因此，商湯方面更願意在千億級規模的模型上發展。運算力國產化是商湯近年的另一大發展重點。徐立透露，公司預測2年內能掌握30000p以上的算力，大約是3萬張NVIDIA H100的運算力。而國產芯片應用方面，徐立期望從目前的五分之一，在2至3年後提升到50%的運算力均由國產芯片提供。徐立對香港AI發展情況表示關注，亦看好香港AI前景，關鍵是要打破場景應用的瓶頸，改變行業現今與AI的生產關係。

↓點擊圖片放大↓