【雲端安全】AWS區域性服務中斷啟示 企業部署須強化Resilience

| ezone.hk 編輯部 | 23-10-2025 16:23 |
【雲端安全】AWS區域性服務中斷啟示 企業部署須強化Resilience

AWS 於 2025 年 10 月 20 日凌晨在美國東岸(US-East-1)區域出現大規模服務中斷,部分核心服務如 DynamoDB、S3 等受影響,多間企業網站及應用程式出現效能下降或無法存取情況。事件再次引發本地IT界對雲端平台可靠性的討論。然而,Gartner 專家認為,今次事故正正為業界帶來反思機會——雲端不是「永遠不會出事」,但只要企業部署得宜,仍然是不少機構實現數碼轉型及 AI 應用的最佳基礎。

區域性事故屬常見現象 需做好風險管理

Gartner 首席分析師 Lydia Leong 指出,是次 AWS 故障主要由 DNS 問題引致,屬於過去十年全球主要雲供應商(包括 Microsoft Azure、Google Cloud Platform)同樣曾出現過的區域性事件。她認為,這類事故並不代表雲端平台不可靠,反而突顯企業必須強化自身系統的「韌性」(Resilience),而不是盲目撤回至本地數據中心或一味轉用其他供應商。

應急方案比「轉台」更實際

不少企業遇到雲端中斷時,會考慮將工作負載遷回本地或選擇多雲部署。不過,Gartner 強調,這類做法未必能真正分散風險,反而可能增加系統整合和維護難度。企業應集中資源優化現有雲端架構,例如採用多可用區、跨區域部署,加強業務持續性(Business Continuity)及災難復原(DR)能力。

三大重點:提升雲端部署抗逆力

1. 分散架構設計:
透過多區域(Region)及多可用區(AZ)部署關鍵應用,即使單一區域發生故障亦可快速切換,縮短復原時間。

2. 嚴格備份及復原演練:
定期進行資料備份及復原測試,尤其是傳統應用遷移上雲後,不應假設自動具備高可用性,必須確保團隊有能力應對突發情況。

3. 善用平台透明度及公開資訊:
AWS 近年持續提升事故透明度,公開相關分析及改善措施,有助企業根據實際風險作出部署調整。

多雲非唯一選擇 優化單一平台效益更高

雖然多雲部署近年成為業界熱話,但 Gartner 指出,除非有監管要求,否則過度追求多雲反而增加技術複雜度,難以帶來預期的效益。大多數企業專注於單一雲端平台、優化架構及自動化流程,更能提升系統穩定性及管理效能。

雲端部署需持續檢討及優化

總括而言,雲端平台偶有服務中斷,屬於可預期的技術風險。企業應從今次 AWS 事故吸取經驗,進一步檢討自身部署策略和災難應變計劃。利用 AWS 及其他主流平台的最新功能,配合完善架構設計和備援機制,依然是推動業務創新及數碼轉型的重要支柱。

資料來源:Gartner

相關文章

Page 1 of 9