Anthropic发布Claude Fable 5:将“禁忌级”的Mythos级能力商业化,定义AI智能体新标准

AI领域顶尖实验室Anthropic近日正式发布了两款重量级新模型——Claude Fable 5 和 Claude Mythos 5。此次发布的标志性意义在于,Anthropic首次将此前仅在受限的网络安全计划“Glasswing项目”中提供给特定组织的强大“Mythos级”AI能力,正式推向更广泛的商业市场。

对于绝大多数用户和开发者而言,Claude Fable 5 将成为目前最强大的通用可用模型。Anthropic表示,Fable 5 在软件工程、知识工作、视觉识别、科学研究及长周期任务等多个维度的表现均超越了此前所有公开版本。在衡量复杂软件工程能力的 SWE-bench Pro 测试中,Fable 5 与 Mythos 5 均达到了 80.3% 的高分,显著领先于 OpenAI 的 GPT-5.5(58.6%)。

值得关注的是,Anthropic 采取了一种极具策略性的“分级发布”机制:Fable 5 与 Mythos 5 共享相同的底层能力基座,但 Fable 5 被包裹在了一层严密的防御机制中。当系统检测到涉及网络安全、生物化学或模型蒸馏等高风险请求时,Fable 5 会自动将任务路由至前旗舰模型 Claude Opus 4.8 处理,并通知用户。而 Mythos 5 则解除了部分限制,但仅向经过审核的资深研究员和网络安全合作伙伴开放。

在实际企业应用中,Fable 5 展现出了惊人的“智能体(Agentic)”执行力。支付巨头 Stripe 的测试显示,Fable 5 在一个拥有 5000 万行代码的 Ruby 代码库中,仅用一天时间就完成了原本需要工程团队耗时两个月的人工迁移工作。此外,Cursor、Replit 和 Figma 等知名开发者工具公司均表示,Fable 5 在处理长周期开发任务和原型构建方面实现了质的飞跃,标志着 AI 正从简单的“代码补全”转向能够独立承担大型工程单元的“自动化工厂”模式。

除了编程,Fable 5 在企业知识工作和视觉理解方面同样强悍。它能从复杂的科学图表中提取精确数据,甚至能仅凭网页截图就重建前端源代码。在金融分析领域,IMC 和 Optiver 等量化交易巨头对其在根因分析和期望值分析中的一致性给予了高度评价。

然而,强大的能力也伴随着更高的商业成本和监管要求。Fable 5 和 Mythos 5 的 API 定价为每百万输入 Token 10 美元,输出 Token 50 美元,虽然较预览版有所下降,但仍是全球最昂贵的前沿模型之一。同时,Anthropic 引入了新的数据保留政策,要求所有 Mythos 级模型的流量必须保留 30 天以确保安全监控,这可能会成为受监管行业企业在采购时重点权衡的因素。

通过此次发布,Anthropic 实际上为前沿 AI 的商业化提供了一套新模板:不再是通过简单的“拒绝回答”来应对风险,而是通过“能力路由”——将日常工作交给最强模型,将高危请求引导至较低风险的模型。这种模式试图在释放极致生产力的同时,守住 AI 安全的底线。

来源: VentureBeat

类似文章

发表回复