《解決DeepSeek模型安全疑慮》Amazon Bedrock Guardrails助企業防「越獄」攻擊及資料外洩

| ezone.hk 編輯部 | 09-03-2025 15:19 |
《解決DeepSeek模型安全疑慮》Amazon Bedrock Guardrails助企業防「越獄」攻擊及資料外洩

中國大型語言模型DeepSeek近月風頭蓋過ChatGPT,號稱低成本高效能,吸引不少企業關注。然而,安全問題隨即浮現,多國政府已相繼禁止在公部門使用,令企業猶豫不決。小編獨家深入剖析DeepSeek模型的安全風險,並探討AWS最新推出的Bedrock Guardrails如何為企業築起安全防線。

DeepSeek模型真的安全嗎?專家:越獄風險高於ChatGPT

中國人工智能初創公司DeepSeek所開發的開源模型DeepSeek R1,自推出以來以接近ChatGPT的效能和完全開源的特性獲得讚譽,有研究人員表示,若將模型下載至本地電腦運行,便可避免資料外洩的憂慮。

小編採訪多位IT專家後,發現情況未必如此樂觀。他們表示,「關鍵是程式碼是否存在『後門』,即使是下載到本地運行的模型,當電腦連線時資料仍有可能被傳輸到其他國家的伺服器。」
更令人擔憂的是,其內部測試發現DeepSeek R1特別容易被「越獄」:「我們評測結果顯示,DeepSeek R1確實比其他模型更容易被越獄,可以被誘導回答如何偷取資料、製作炸彈等敏感問題,防禦功能明顯弱於ChatGPT。」

AWS推新方案:Amazon Bedrock Guardrails全方位保護

針對企業在採用DeepSeek等開放權重模型時所面臨的安全挑戰,AWS近日推出Amazon Bedrock Guardrails解決方案,為企業提供全面保護。

該方案允許企業在Amazon Bedrock平台上安全部署DeepSeek-R1模型,並透過多層次防護機制解決已知安全漏洞。AWS機器學習部門專家Satveer Khurpa向本報透露:「我們看到越來越多企業希望利用DeepSeek等開放模型的創新能力,但同時很擔心安全風險,Amazon Bedrock Guardrails正是為解決這一痛點而生。」

四大安全防護機制突破傳統限制

Amazon Bedrock Guardrails提供五大核心防護機制,特別針對DeepSeek模型易被越獄的弱點:

  • 內容過濾器:可調整強度的有害內容過濾,阻止仇恨、暴力等不當內容
  • 主題限制:企業可設定禁止模型討論的敏感主題範圍
  • 詞彙控制:阻止特定詞彙及褻瀆語,可自訂企業專用詞彙表
  • 敏感資訊保護:自動識別並遮罩個人識別資訊,避免資料外洩

Amazon Bedrock Guardrails能同時對輸入和輸出進行檢查,為DeepSeek等開放權重模型提供全方位防護。系統使用InvokeModel API和ApplyGuardrails API兩種方式實施保護,確保模型輸出符合企業的安全和合規要求。

專家建議:沙盒測試仍不可少

儘管AWS提供了強大的保護機制,IT專家仍建議企業採取謹慎態度。「在模型原始碼完全通過資安檢核前,最好在封閉的沙盒環境中使用,並監控所有對外連線。」

他們提醒:「不只是DeepSeek,任何大型語言模型都可能存在被濫用的風險。最基本的原則是避免將敏感資訊如信用卡號碼輸入到任何模型中。」

未來展望:安全與創新並重

隨著生成式AI的快速發展,企業如何在創新與安全之間取得平衡將是關鍵課題。AWS專家預計,未來類似Amazon Bedrock Guardrails的安全框架將成為標準配置,讓企業能夠安心採用各種開源模型。

AWS專家建議企業應定期審查和更新不僅是防護機制,還有所有安全控制,以應對新的潛在漏洞,並在快速發展的AI安全格局中保持防護能力。

欲了解更多關於Amazon Bedrock Guardrails的詳情,可瀏覽:Protect your DeepSeek model deployments with Amazon Bedrock Guardrails

相關文章

Page 1 of 9

最新內容