Anthropic 發布 Claude Fable 5 及 Mythos 5「同一模型、兩種存取級別」分層制度 API 定價較前代下調逾五成
| Simon Chan | 10-06-2026 06:14 |

Anthropic 於 6 月 9 日正式發布旗下最新旗艦模型系列 Claude Fable 5 及 Claude Mythos 5。兩者為同一底層模型,但面向截然不同的用家群體及存取權限——這種「同一模型、兩種存取級別」的雙軌發布架構,是目前商用 AI 領域前所未見的治理模式,被業界視為 Anthropic 在能力與安全平衡問題上的一次重要示範。API 定價方面,兩款模型均定價為每百萬輸入 tokens $10、每百萬輸出 tokens $50,較前代 Claude Mythos Preview 下調逾 50%。
核心架構:同一底層模型,兩層存取制度
今次發布最值得業界關注的,並非單一模型的能力數字,而是 Anthropic 採用的發布架構本身。Fable 5 和 Mythos 5 使用完全相同的底層模型,差異在於後者在特定領域撤除了前者的安全護欄。
這種設計的邏輯是:Anthropic 認為 Fable 5 的能力——尤其是網絡安全相關能力——若無限制地開放,存在被惡意利用的現實風險。因此採取分層策略:
- Claude Fable 5(通用版):面向所有用家,加入安全護欄,在特定敏感話題上自動 fallback 至 Claude Opus 4.8 處理
- Claude Mythos 5(受信任存取版):面向網絡防衛者及關鍵基建供應商,撤除特定領域護欄,初期透過 Project Glasswing 與美國政府合作部署;Anthropic 表示未來將擴展至更廣泛的受信任存取計劃
在商用 AI 發展史上,此前的業界慣例是:一個模型使用同一套護欄面向所有用家,或完全不設護欄。「同一模型底層、按用家身份分層撤除護欄」的雙軌制度,是目前主要 AI 廠商中的首例,其影響超越技術本身,涉及 AI 監管、存取控制及責任歸屬等深層治理問題。
Fable 5 的護欄機制:5% Fallback 率與保守調校
Anthropic 在公告中罕見地披露了護欄機制的具體參數。當用戶的查詢觸及護欄設定的敏感範疇(主要包括網絡安全相關內容),系統會自動將請求 fallback 至 Claude Opus 4.8 處理,用戶不會看到明確的拒絕回應。
Anthropic 坦承,為了「既安全又快速地發布模型」,護欄現時調校偏向保守,平均每 100 個 sessions 有少於 5 個會觸發 fallback,當中部分屬於無害請求的誤判(false positive)。Anthropic 表示正積極優化以減少誤判率,但同時指出隨著更高能力模型在未來數月陸續推出,護欄亦會相應改善。
這一設計選擇揭示了一個業界長期爭議的核心矛盾:能力愈強的模型,精準設計護欄的難度愈高。Anthropic 選擇以「保守調校、接受少量誤判」換取更快的安全發布,是一個值得關注的取捨決定。
Mythos 5 與 Project Glasswing:美國政府合作的網絡安全部署
Claude Mythos 5 是 Anthropic 迄今能力最強的網絡安全模型,初期透過 Project Glasswing 向受信任機構提供——這是 Anthropic 與美國政府的合作框架,目標是協助網絡防衛者使用 AI 能力保護關鍵軟件基建。
Anthropic 在公告中引述了 Project Glasswing 的早期成果:Mythos 5 已協助網絡防衛者識別並修復若干關鍵軟件的安全漏洞,具體細節因安全考量未予完整披露。
Anthropic 表示將擴展 Mythos 5 的存取至「更廣泛的受信任存取計劃」,但目前未公布具體標準或時間表。這意味著大多數企業用家在可見將來仍只能透過 Fable 5 取用相關能力。
核心能力:軟件工程、知識工作、視覺、長文脈
Anthropic 在公告中公布了幾個值得業界關注的能力評估結果:
軟件工程:在 Cognition 的 FrontierCode 評估(測試模型能否在通過生產級代碼標準的情況下完成高難度編程任務)中,Fable 5 在前沿模型中取得最高分。Stripe 在早期測試中報告,在其 5,000 萬行 Ruby codebase 上,Fable 5 單日完成了一次全庫遷移,同等工作量若由人工完成需整隊工程師超過兩個月。
知識工作:在 Hebbia 的資深級別金融推理評估中,Fable 5 取得所有模型中的最高分,在文件推理、圖表解讀及問題解決等維度均有明顯優勢。IMC 亦報告 Fable 5 在其交易分析評估(包括事實查找、概念推理、根因分析及期望值分析)中近乎全面達標。
視覺能力:Fable 5 在視覺任務上成為業界最強模型,可從科學圖表中精確提取數字、僅從截圖重建網頁源代碼。值得注意的是,此前的 Claude 模型即使配備輔助工具仍難以完成 Pokémon FireRed 遊戲,Fable 5 僅憑原始遊戲截圖(無地圖、無導航輔助)即完成通關。
記憶與長文脈:Fable 5 可在百萬 token 的長任務中維持焦點,並利用自身筆記改善輸出。在 Slay the Spire 測試中,持久記憶對 Fable 5 的效能提升是 Opus 4.8 的三倍。
生命科學突破:藥物設計加速十倍、獨立驗證的分子生物假說
Anthropic 在公告中披露了 Mythos 5 在生命科學領域的成果,是今次公告中技術含量最高的部分:
- 藥物設計加速:Anthropic 內部蛋白質設計專家使用 Mythos 5 後,藥物設計流程特定環節加速約十倍。在其中一個測試中,Mythos 5 在無人類協助的情況下,完整執行了科學家通常需完成的全部任務——選擇結合位點、選取並運行蛋白質設計工具、從失敗中復原。14 個蛋白質目標中有 9 個產生了強候選,Anthropic 表示正對此進行進一步調查。
- 首個通過獨立驗證的 AI 科學假說:Anthropic 報告 Mythos 5 是其首個能持續產生新穎、具說服力科學假說的模型。在與 Opus 級模型的盲測比較中,科學家約 80% 的情況下偏好 Mythos 5 的分子生物學假說。其中一個關於大腸桿菌蛋白質新機制的假說,已在一個獨立工作於同一問題的實驗室的預印本研究中得到證實。
- 基因組學自主研究:Mythos 5 在逾一週的高度自主工作中,整合了跨 138 個動物物種的數百萬個單細胞數據,並設計並訓練了一個定製機器學習模型,在僅有高層次人類輸入的情況下,以 100 倍更小的規模超越了《Science》期刊最近發表的一個模型。
企業實測:Stripe、GitHub、Cursor 的早期反饋
Anthropic 公布了多個獲早期存取的企業用家反饋,其中幾個值得讀者關注:
- Cursor(AI 代碼編輯器):「Fable 5 是 CursorBench 上最先進的模型,開啟了此前無法觸及的一類長任務問題。」
- GitHub:「在早期測試中,Fable 5 以超越此前水準的自主性和可靠性完成複雜的長任務編碼工作。」
- Harvey(法律科技):「在盲測中,我們的律師發現 Fable 5 的合約標注每次均達到或超越我們現有模型。」
對齊評估:誤對齊行為水平與 Opus 4.8 相近
Anthropic 在公告中披露了 Fable 5 / Mythos 5 的自動對齊評估結果:模型的誤對齊行為水平(包括欺騙行為及配合用戶誤用等)與 Opus 4.8 相近且處於低水平。由於兩款模型底層相同,Fable 5 的對齊水平與 Mythos 5 類似。詳細評估方法及結果見 Anthropic 同步發布的 System Card。
定價及可用性
| Claude Fable 5 | Claude Mythos 5 | |
| 存取對象 | 所有用家(API / claude.ai) | 限網絡防衛者及關鍵基建供應商;透過 Project Glasswing 申請 |
| 護欄 | 有(特定敏感話題 fallback 至 Opus 4.8) | 在特定領域撤除護欄 |
| API 定價(輸入) | $10 / 百萬 tokens | $10 / 百萬 tokens |
| API 定價(輸出) | $50 / 百萬 tokens | $50 / 百萬 tokens |
| 較前代(Mythos Preview)定價 | 下調逾 50% | |
| 即時可用性 | 今日起(API 及 claude.ai) | 今日起(Project Glasswing 現有合作機構);更廣泛受信任存取計劃待定 |
雙軌制度的 AI 治理意義
今次發布的技術能力數字固然值得關注,但從 IT 行業的視角,雙軌分層發布制度才是最具長遠意義的部分。
過去,AI 廠商面對「能力與安全」的矛盾,通常有兩種選擇:一是對所有用家使用同一套護欄(犧牲高需求用家的能力);二是完全不設護欄(將風險責任轉嫁給用家)。Anthropic 今次採用的第三條路——同一底層模型、按用家身份和可信度分層撤除護欄——在邏輯上更接近傳統高危工具的管理模式:醫療、金融等行業對同一類工具,向不同資質的持牌人授予不同使用權限。
這種模式的可行性,取決於幾個尚未完全解決的問題:
- 存取資格認定:「網絡防衛者」及「受信任機構」的認定標準和流程,目前 Anthropic 尚未完整公開,這是制度能否推廣的關鍵
- 責任鏈:若獲授予 Mythos 5 存取權的機構出現誤用,Anthropic 與該機構之間的責任如何劃分
- 可擴展性:隨著存取計劃擴大,如何維持審核質量
無論如何,Anthropic 今次的發布是對「AI 能力愈強就愈危險、只能選擇限制或開放」這一二元論的一次實際挑戰。它的成敗,將為整個業界提供一個重要的參考案例。
Fable 5 的 System Card 及完整評估報告已同步發布,可於 anthropic.com 查閱。
Source : Anthropic
