中國人工智能企業商湯科技(Sense Time)於上海人工智能計算中心 (AIDC) 舉辦技術交流日,發布「日日新SenseNova 5.0」大模型體系。商湯科技董事長兼首席執行官徐立博士接受ezone.hk記者訪問,談及商湯在人工智能的發展,並即場演示大模型和一系列最新側端大模型的實際應用情況。
徐立表示,商湯日日新5.0大模型在知識、數學、推理及代碼能力,都相當接近或在高階推理方面超越GPT-4 Turbo。發布會現場更演示商湯日日新5.0的「秒畫 SenseMirage」文生圖功能,對比目前其他主流生成模型,如:Stable Difussion,Dall-E 和 MidJourney,記者現場所見「秒畫」圖片的人物和動物上的質感、紋理表現都較其他三者為佳,同時,亦更準確地掌握中文語言指令。
此外,「商量SenseChat」千億級參數語言大模型也即場演示多個獨特場景下的應用情況,包括:大型數據分析、圖片內容識別等。徐立特別強調,「從感知到生成」的過程表現提升。目前,商湯人工智能大模型的算力基礎,主要由NVIDIA A800、H800和 GeForce RTX 4090D三款GPU推動,也投入了近 14 款國產芯片在超算中心的營運當中。在算力國產化上,商湯與華為等國內芯片商合作,目前做到800p的算力由國產芯片推動。
商湯科技更推出「企業級大模型一體機」。針對金融、醫療、政務和代碼四大方面的AI應用而設,透過商湯設計的行業大模型更快更準確地為客戶提供相關服務。具體來說,它可同時支持企業級千億模型加速和知識檢索硬件加速,實現本地化部署,即買即用,每台售價35萬人民幣起,最多支援100人團隊使用,成本最低可達每天每人4.5元人民幣。相比同類產品,推理成本節約80%,CPU工作負載減少約50%。徐立也提到早前的OpenAI Sora文生影片模型引起極大關注,而商湯目前仍在這方面努力當中,但相信很快有好消息公布。
會後,記者與徐立進行更深入的交流。對於開發較小型的模型原因,徐立回應指,ChatGPT和Meta的模型雖大而且具通用知識,但是沒有為特定行業所需而設計。因此,商湯方面更願意在千億級規模的模型上發展。運算力國產化是商湯近年的另一大發展重點。徐立透露,公司預測2年內能掌握30000p以上的算力,大約是3萬張NVIDIA H100的運算力。而國產芯片應用方面,徐立期望從目前的五分之一,在2至3年後提升到50%的運算力均由國產芯片提供。徐立對香港AI發展情況表示關注,亦看好香港AI前景,關鍵是要打破場景應用的瓶頸,改變行業現今與AI的生產關係。
【相關報道】
Source:ezone.hk