
商湯技術交流日2025|人工智能(AI)技術浪潮席捲全球,其背後龐大的基礎設施建設,成為業界競爭的焦點。商湯科技(SenseTime)近年積極佈局其核心AI基礎設施載體「商湯大裝置」(SenseCore),ezone.hk 日前訪問商湯科技大裝置事業群總裁楊帆,探討商湯在這項前瞻性戰略背後的思考邏輯、實踐進展以及對未來產業格局的展望。
楊帆表示,商湯自2014年成立以來,便持續探索AI產業的長遠發展路徑以及技術創新的商業化模式。他們深刻認識到,AI作為一種通用目的技術(GPT),必須與下游的具體應用場景和產業深度融合,才能真正釋放其價值。基於此洞察,商湯早在2018年至2019年,遠在大型語言模型(LLM)引爆市場之前,便已前瞻性地預見到未來AI發展對大規模、彈性化基礎設施的依賴,並開始著手進行千卡級別的並行訓練研究與投入。
前瞻佈局 AI基建非僅算力堆疊
「我們很早就意識到,未來人工智能的發展,特別是當技術演化到更強的通用能力時,一定會需要巨大的前期投入,尤其是算力。」楊帆解釋道。為避免整個產業陷入長期高投入、低回報的困境,並借鑒其他產業基礎設施化的發展經驗,商湯率先提出構建「人工智能基礎設施」的理念。
楊帆特別強調,商湯所定義的AI基礎設施,並非狹隘地等同於算力中心的建設。「它不僅僅是算力的基礎設施,也包括算法和數據的基礎設施。」他認為,AI的三大核心要素,包括:算力、算法、數據,最終都將走向基礎設施化,如同水電煤一般,為下游應用提供底層支撐。他指出:「像今天的大模型,其實就是算法基礎設施的一種形態。」通過建設這樣一個綜合性的AI基礎設施體系,商湯的目標是大幅降低下游應用開發者和模型使用者的成本與技術門檻,從而推動AI技術更廣泛、更深入地滲透到各行各業。
緊貼市場脈搏 GenAI轉型初見成效
2022年底以來,以ChatGPT為代表的生成式AI技術的突破,極大地提升全社會對AI潛力及大規模投入必要性的認知。楊帆表示,商湯亦順勢而為,將其「大裝置」、大模型及相關應用整合,確立向GenAI全面轉型的戰略方向。從2023年至2024年,商湯在這次結構性轉型上已初步取得成效,其最新的財務報告亦反映這一積極趨勢。然而,他也坦承,當前AI行業仍面臨巨大的不確定性,包括下游技術應用的快速迭代和上游供應鏈(尤其是高性能晶片)的不穩定性。「我們希望能夠用我們的積累,包括前瞻性的思考、技術儲備和know-how,來對沖掉這些不確定性,給下游客戶一個更穩定的選擇。」
沉澱核心能力 提升客戶應用性價比
面對算力成本普遍高昂的現狀,楊帆強調,商湯的核心目標之一是將自身積累的技術能力和優化能力沉澱下來,為客戶提供具備更高性價比的AI解決方案。「即使這個市場客觀規律導致了成本很高,但是否能夠通過我們的優化,讓客戶使用大模型相關服務的時候,獲得一個更高的端到端性價比。」
他以智能機器人領域的客戶為例,許多客戶在獲取高質量訓練數據方面面臨成本高昂和技術複雜的挑戰。商湯便可利用其在智能駕駛等領域積累的3D平台引擎能力,幫助客戶生成大量虛擬的機器人訓練數據,以更低成本、更高效率地滿足模型訓練需求。同時,針對客戶在特定場景下對成熟視覺模型的需求,商湯也能開放其多年積累的算法儲備,提供更完整的解決方案,最終目標是幫助客戶提升性價比,降低行業的進入門檻。
國產晶片策略 實測推動商業化閉環
談及備受關注的國產晶片議題,楊帆坦誠,目前商湯的算力集群仍以英偉達晶片為主,但國產晶片的使用比例正逐年快速提升。他回憶道,商湯早於數年前便牽頭成立產業聯盟,聯合國產晶片廠商、頭部平台公司及學術機構,共同推動國產AI晶片行業的標準化,以打破標準不統一對生態發展的制約。
自2022年臨港計算中心投入運營以來,商湯一直與各大國產晶片廠商保持緊密合作和持續評測。楊帆強調,商湯的評測不僅關注晶片本身的硬件規格,更著重其在真實下游應用場景中的實際表現,例如運行Llama 3等開源模型時的輸出效率、性能,並結合成本進行綜合性價比分析。去年,商湯更與國內頂尖科研機構合作,成功將約5000張來自四家不同廠商的國產晶片連接起來,協同運行同一訓練任務,實現高達80%的硬件算力利用率,且在異構環境下的訓練效率達到同構環境的95%,有力證明了技術手段可有效克服國產晶片在市場化初期可能遇到的限制。
AI專家服務與輕資產模式 應對市場挑戰
除了基礎設施,商湯亦將其內部積累的AI專業知識打包成「AI專家服務」,協助缺乏相關能力的客戶將大模型有效落地於實際業務場景。例如,幫助客戶優化模型在特定國產晶片上的運行性能,使其達到滿意的性價比,從而推動國產晶片的應用。楊帆認為,提升國產晶片的易用性和終端用戶性能,是其走向市場化的關鍵。
目前,商湯的總算力規模已超過23000 Petaflops,楊帆預計未來算力按年會有高雙位數至三位數字的增長,算力來源採用包括自建(重資產)和聯合運營(輕資產)在內的混合模式。楊帆指出,與擁有算力資源但缺乏運營能力的夥伴合作,有助於節省現金流、提高資源利用效率,並能更靈活地應對上游供應鏈的不確定性,為客戶提供更多元的選擇。商湯的核心競爭力在於其算法、軟件平台和解決方案,而非單一依賴某種晶片。
擁抱開源趨勢 積極佈局灣區與香港
面對開源模型的蓬勃發展,楊帆表示,「商湯大裝置」已接入眾多主流開源模型,並在去年通過SenseCore 2.0的重大升級,全面擁抱開源生態,兼容開源模型及中間件工具框架,以降低客戶的遷移成本。他認為,類似DeepSeek等低成本模型的出現,實際上是提升了AI的性價比,將會打開更多應用場景,反而促進總體算力需求的增長。
展望未來,楊帆看好具身智能機器人、AIGC(AI內容生成)、AI for Science(AI驅動的科學發現)以及多模態大模型等細分領域的發展潛力,並指出產業智能化轉型亦是長期價值所在。在地域佈局方面,商湯已在深圳前海設立算力中心,利用其政策和地理優勢服務包括香港在內的區域。楊帆表示,商湯對在香港發展算力業務持開放態度,正與潛在夥伴洽談聯合運營等合作模式,希望將商湯的平台、軟件和服務能力,與資產型投資者結合,共同推動香港AI基礎設施的建設。
Source:ezone.hk
【延伸閱讀】