• Facebook
  • Instagram
  • 科技焦點
    • iPhone
    • 電腦
    • 智能家居
    • 5G流動
    • 數碼
    • 科技
    • 汽車
    • 人工智能
  • 網絡生活
    • 網絡熱話
    • 筍買情報
    • 生活情報
    • 旅遊筍料
    • 熱門話題
  • 遊戲動漫
    • 熱門遊戲
    • 電競裝備
    • 動漫玩具
  • 教學評測
    • 應用秘技
    • 新品測試
    • Apps 情報
  • EduTech
    • EduTech Today
    • EduTech Pro
    • EduTech@School
  • IT Times
    • 業界頭條
    • AI 策略
    • 名家專欄
  • 生成式AI與雲端應用
  • 特集

Red Hat推開源企業級推理伺服器解決方案 大幅釋放AI運算能力

| 李彥煒 | 05-07-2025 11:31 |
Red Hat推開源企業級推理伺服器解決方案 大幅釋放AI運算能力

人工智能(AI)熱潮持續,企業競相採用,但許多企業逐漸意識到,構建AI應用及管理和使用AI需投入大量資源。Red Hat近期推出多種解決方案,助企業釋放AI運算潛力,建立私人AI(Private AI)應用,提升AI使用的安全性與效率,同時提高投資回報率(ROI)。

現時企業開始大量使用AI,Red Hat台灣、香港、澳門及中國華南區區域總經理文志鋒(Peter) 表示,企業在使用或部署AI時,特別關注AI的安全性、效率、以及投資回報率(ROI),開源(Open source)平台就最為適合,可解決安全性問題。「正正因為開源平台,系統源碼全部可見,不可能藏有任何漏洞,即使有,都會被即時發現及移除。」

最高提升24倍GPU效能

生成式AI應用日益普及,企業可選擇多款大型語言模型(LLM),如DeepSeek、Gemma、Llama等。然而,隨著AI模型複雜度增加,推理過程耗費大量GPU資源,導致回應速度變慢及營運成本上升。為此,Red Hat推出AI推理伺服器(Red Hat AI Inference Server)解決方案,整合vLLM與Neural Magic技術,優化GPU運算效能,同時兼容多種AI模型。Red Hat 香港、澳門及台灣方案工程總監羅國柱(Albert)指出,當前GPU採購難度高,企業要提升投資回報率(ROI),必須充分釋放GPU效能。

Red Hat推開源企業級推理伺服器解決方案 大幅釋放AI運算能力
Red Hat台灣、香港、澳門及中國華南區區域總經理文志鋒(Peter) 表示,開源(Open source)平台的系統源碼全部可見,不可能藏有任何漏洞,即使有,都會被即時發現及移除。

新方案以容器(container)技術為基礎,羅解釋,新方案將預訓練模型轉化為實際應用成果,可節省75%的資源,並提升GPU效能430%。「透過AI模型量化(Quantization)壓縮技術,過去需要4張GPU的任務,現只需1張GPU即可完成,最高可釋放24倍效能。」他補充,雖然模型壓縮技術提升GPU效能的同時會略微降低AI準確度,但仍足以滿足企業需求。「在W8A8壓縮模式下,即50%壓縮率,準確度仍接近100%。」

Red Hat推開源企業級推理伺服器解決方案 大幅釋放AI運算能力
Red Hat AI Inference Server解決方案以容器(container)技術為基礎,將預訓練模型轉化為實際應用成果,可節省75%的資源,並提升GPU效能430%。

企業逐步應用Private AI應用

企業逐步使用生成式AI,Red Hat亦為其開源平台推出更新版Linux 10版本,當中加入Lightspeed功能,可作為用戶的小助手,解決各種Linux系統操作及管理上的疑問及困難。惟企業使用生成式AI愈益頻繁,當中無可避免地要將企業敏感資料放到AI模型上分析,當中或出現資料外洩風險。羅表示,一方面,要將資料放上公有雲,其計費方式難以預算,或出現天文數字,其次,是數據安全問題。

Red Hat推開源企業級推理伺服器解決方案 大幅釋放AI運算能力
Red Hat 香港、澳門及台灣方案工程總監羅國柱表示,現時有企業客戶開始部署Private AI,結合代理式AI(Agentic AI)在企業內部環境執行任務,可大大減低資料外洩風險。

因此,企業開始部署私人AI(Private AI)。羅舉例,有跨國企業客戶的HR部門需回應員工關於年度假期天數的查詢,但因各地公眾假期差異,難以提供統一答案,且當中涉及各地政府政策、企業文化及規範等複雜資料。他透露,現時開始有企業客戶部署Private AI,結合代理式AI(Agentic AI)在企業內部環境執行任務,可大大減低資料外洩風險。他補充,企業採用AI通常分為四個階段,而香港企業目前多處於第三至第四階段之間。

Red Hat推開源企業級推理伺服器解決方案 大幅釋放AI運算能力
Red Hat 香港、澳門及台灣方案工程總監羅國柱表示,企業採用AI通常分為四個階段,而香港企業目前多處於第三至第四階段之間。

  1. 為非敏感的案例採用公有雲探索AI應用
  2. 在混合雲端環境中管理AI應用
  3. 將企業機密資料融入私人AI
  4. 使用私人Agentic AI自動化關鍵工作流程

羅表示,企業採用AI通常分為四個階段,而香港企業目前多處於第三至第四階段之間。他解釋,雖然企業使用生成式AI或成常態,但部署Private AI的企業仍是少數,且屬於初步應用階段。「當中的工作流程、案例都是一些非業務核心的工作流程及實驗性質,相信企業未來仍需時間去適應。」他建議,企業要安全地使用AI,必須要「Bring AI to your data,not bring data to your AI。」

Source:ezone.hk

【延伸閱讀】

  • Google推開源Gemini CLI!AI Agent 進駐終端機 極速提升開發效率
  • Manus AI|AI團隊3小時破解Manus Github開源免費體驗 有齊安裝教學
  • 阿里巴巴發表 Qwen3 開源 AI!推理能力超越 DeepSeek R、OpenAI o1!
科技

相關文章

「粵車南下」服務升級 短期三保登場,一日都買得

【IT觀點】【電商必修課】掌握庫存管理關鍵三招

國泰數碼深圳資訊科技辦公室正式開幕 大灣區三大IT基地創協同效應 

Higgsfield AI 唔洗識拍片都得!AI一鍵生成電影短片 社交媒體吸睛必備

Page 1 of 9

科技焦點

  • iPhone
  • 5G流動
  • 電腦
  • 數碼
  • 智能家居
  • 科技
  • 汽車
  • 人工智能

網絡生活

  • 網絡熱話
  • 生活情報
  • 筍買着數
  • 旅遊筍料
  • 熱門話題
  •  
  •  

遊戲動漫

  • 熱門遊戲
  • 電競裝備
  • 動漫玩具

教學評測

  • 應用秘技
  • 新品測試
  • Apps 情報

IT Times

  • 業界頭條
  • AI 策略
  • 名家專欄

其他

  • 私隱政策
  • 免責聲明
  • 聯絡/關於我們

© 2025 e-zone. All Rights Reserved.