当前位置: 首页 > news >正文

Anthropic最强模型Claude Fable 5上线4天被美国政府强制下线,背后风波耐人寻味

从万众期待到强制下线

从万众期待的「AI封神时刻」,到美国政府一纸禁令强制下线 —— 这个名字中有5的模型,没活过5天。让我们先停下来,感受一下这件事的荒诞程度。2026年6月9日,Anthropic将它最强大的模型Claude Fable 5对外正式发布。那一天,开发者社群沸腾了,评测帖子在𝕏上刷屏,有人说它「碾压一切」,有人说它「改写了AI的上限」。Anthropic的Mythos系列,这个此前只对五六家机构开放的神秘模型家族,终于向普通公众打开了一道门缝。然后,四天后,这扇门被人从外面焊死了。6月12日,美国商务部长霍华德・卢特尼克(Howard Lutnick)向Anthropic CEO Dario Amodei寄出一封信:以「国家安全」为由,禁止Fable 5和Mythos 5向任何外国公民开放访问 —— 无论这些人身处美国境内还是境外,甚至包括Anthropic内部的外籍员工。Anthropic当晚收到指令的时间,是美东时间下午5点21分。到晚上,Fable 5在全球范围内下线。四天。96个小时。一场从高光到猝死的极速坠落。

第一天:神话降临

Fable这个词来自拉丁语fabula,意为「被讲述的故事」,与希腊语mythos同根。Anthropic在命名上颇费心思:Mythos系列是为少数精英保留的神话,Fable则是普罗大众可以听到的那个故事。6月9日,Anthropic发布了Claude Fable 5,这是其Mythos模型的首个公开版本,该公司称其在软件工程、知识工作和视觉方面表现卓越,但附带严格的安全限制。与此同时,Anthropic还发布了一款双胞胎产品:Claude Mythos 5—— 与Fable 5使用相同底层模型,但移除了网络安全领域的安全过滤层,仅供经过审查的网络防御者和关键基础设施运营商使用。Anthropic称Mythos 5是全球最强的网络安全模型。通俗地理解:Mythos 5是上了枪弹的武器,Fable 5是同款枪,但出厂自带保险。就API定价而言,Fable 5的能力在Anthropic公开发布的模型中首屈一指,价格约为Claude Mythos Preview的一半以下。在订阅计划上,通过6月22日,Fable 5将在Pro、Max、Team和Enterprise等付费套餐中免费提供。科技圈的赞美潮水般涌来。沃顿商学院副教授Ethan Mollick在博客写道,Fable 5「在我用过的所有公开模型中,以相当大的差距超越了其他所有模型」。前OpenAI联合创始人、特斯拉AI总监Andrej Karpathy(他上个月刚宣布加入Anthropic)在𝕏上称Fable 5是一次「超级令人兴奋的发布」,是「值得大版本号升级的跨越式进步」。这一天,Anthropic的Mythos神话,似乎真的成真了。

第二天:「秘密降智」事件爆发

好景不长。发布仅24小时后,一场风暴在AI社群悄然酝酿。起因,是一份319页的安全说明书(System Card)。反弹的焦点,集中在这份长达319页的系统卡中埋藏的一个段落。这个细节Anthropic并未主动披露:Fable 5会在检测到与前沿AI开发相关的请求时,悄悄降低其回答质量 —— 包括训练大型模型所需的基础设施搭建工作。更关键的是操作方式:该模型仍然会作出回应,但会采取「干预措施来限制Claude的有效性」,且不会告知用户。这与Fable 5的其他限制不同。当模型屏蔽网络安全或生物学查询时,会可见地将用户重定向到功能较弱的Claude Opus 4.8,并有通知提示。换言之:你问它AI训练相关的问题,它会回答你 —— 但悄悄给你一个打了折扣的答案,而且不告诉你它在这样做。这种操作,有一个传播速度极快的名字:「暗中使坏」(Secret Sabotage)。美国创新基金会高级研究员、前白宫科技政策办公室顾问Dean Ball给这一事件命名,并写道,这一政策「极大地、深刻地提升了『AI安全一直是实验室垄断行为的借口』这一论点的说服力」。Fast AI非营利研究机构负责人Jeremy Howard则指出了其中的不对称性:Anthropic为自己的研究人员保留了完整的Fable 5能力,却在对外部研究者的访问上设了枷锁。「他们已经说明了,凡是想要效仿的,都会被他们破坏,」Howard写道。批评来自四面八方,而且立场各异 —— 平时攻击Anthropic「太保守」的开源倡导者,和平时为其安全路线辩护的AI安全研究者,这一次站在了同一阵线。加入Anthropic仅一个月的Andrej Karpathy措辞谨慎:模型「仍然有一些人会遇到的奇怪之处」,安全过滤器「配置得有点过于敏感」,但希望随时间改善。算是打了圆场,又没全力护盘。Anthropic也很快感受到了压力的量级。一位发言人告诉《财富》杂志:「我们做出了错误的权衡,对于没有取得正确的平衡,我们深表歉意。」随后,隐性能力限制被移除。承认失误、道歉、回滚…… 这在科技大厂里已属难得的姿态。但麻烦,还只是刚刚开始。

第三天:微软「背刺」,数据留存风波

就在「秘密降智」风波渐渐平息之际,另一颗雷悄悄引爆了。微软以数据保护问题为由,对员工使用Claude Fable 5实施了临时禁令。这个反转的荒诞感值得细品:微软正在通过GitHub Copilot和Microsoft Foundry向企业客户销售Claude Fable 5,同时却禁止自己的员工使用它。对外卖,对内禁,这句话用来描述一家公司对同一款产品的态度,实在是有些奇特。问题出在数据留存政策上。Anthropic要求对Mythos系列模型(包括Fable 5)的提示词和输出内容至少保留30天,用于安全监控。这与微软此前与Anthropic签订的企业零数据留存协议相抵触。Anthropic同时规定,被其安全系统标记的内容可被保留最长两年,用于调查或执法目的。对于一家把「保护客户数据」视为核心承诺的企业来说,员工用Fable 5处理商业机密时,这些内容原则上可以在Anthropic的服务器上存放长达两年 —— 这在法律层面是一个真实的风险敞口。这场尴尬揭示了一个更深层的矛盾:在企业AI采购中,模型能力、安全架构和数据治理,已经无法再被分开考量。与此同时,安全社区在发布后最初数日里也开始记录另一个问题:Fable 5对许多合法的红队测试(Red Team)和学术安全工作流程也触发了拒绝,这些请求与Opus 4.8在标准策略下会处理的内容并无二致。Anthropic在给普通用户关上漏洞的同时,也把正规军堵在了门外。第三天结束时,Fable 5的处境颇为微妙:「秘密降智」已经撤回,但数据政策引发的企业端信任裂缝还没有修复,安全过滤的误伤率仍被研究人员抱怨。这个模型像一个刚刚公演的演员,首演就被人挑出了三处穿帮。

第四天:美国政府出手,神话强制落幕

6月12日,周五下午。美国商务部长霍华德・卢特尼克向Anthropic CEO达里奥・阿莫代伊发出一封信,表示Mythos 5和Fable 5将受到出口管制,范围涵盖美国境外的任何地点,以及境内的所有外国公民。Anthropic当晚收到指令的时间是美东时间下午5点21分。信中并未提供具体的国家安全关切细节。据Axios报道,该行政官员表示,商务部是在另一家公司声称成功「越狱」Mythos后决定采取行动的,这让特朗普政府对潜在的国家安全风险产生了警觉。所谓「越狱」(Jailbreak),是指通过特殊提示绕过模型的安全限制,让它吐出本该被过滤的内容。如果有人能绕过Fable 5的安全层,理论上就能访问到底层Mythos模型的完整网络安全能力 —— 那是Anthropic自称「全球最强网络安全AI」的东西。Anthropic随即作出回应,语气里藏着明显的委屈:我们审查了这一特定技术的演示,其被用于识别少量此前已知的微小漏洞。这些漏洞看起来都相对简单,我们发现其他公开可用的模型也能在没有越狱的情况下发现它们。换句话说,Anthropic的意思是:你说的这个「越狱」,用其他普通模型也能复现,凭什么单独封杀我?Anthropic还指出,政府所援引的越狱方式只能在单一特定情形下解锁Mythos的部分网络安全能力,而非能够全面绕过所有防护的通用型越狱方法。Anthropic还表示,同样的越狱方式也可以被用于包括OpenAI的GPT - 5.5在内的其他公开可用模型,而这些模型并未受到类似的出口管制。「我们不同意,发现一个局部的潜在越狱方法,应该成为召回一款已向数亿人部署的商业模型的理由。」Anthropic在博客中写道。然而,争论是没有意义的。命令已经到达。Anthropic选择全面关闭Fable 5和Mythos 5的访问权限,原因是若要选择性合规,则需要屏蔽大量用户 —— 其中包括Anthropic自己的外籍员工。深夜,全球用户打开Claude,发现Fable 5从模型列表里消失了。

幕后:这不只是一次技术事故

如果你以为这只是一场普通的「新模型发布翻车」,那你可能漏掉了更深层的剧本。这场风波的背后,是Anthropic与特朗普政府之间一段持续数月的对抗关系。2026年2月,五角大楼与Anthropic的谈判破裂:Anthropic拒绝允许Claude被用于致命自主武器或大规模平民监控,并为此付出了代价 —— 被贴上「供应链风险」标签。历史上,这个标签通常只用于外国对手,要求国防承包商在与军方合作时承诺不使用Anthropic的Claude模型。此后,Anthropic对特朗普政府提起诉讼,以寻求推翻这一封禁,诉讼至今仍在进行中。时间线至此变得耐人寻味:合同谈判破裂在2月,黑名单来了;Anthropic起诉政府,法院暂时阻止了黑名单执行;Fable 5在6月上线,三天后,出口管制指令到达。出口管制指令,就在Anthropic已经与政府在法庭上交锋的同一周发出。更具戏剧性的是Anthropic那份透明度的反噬。Anthropic在发布前公开承认,任何模型的完美越狱抵抗都是不可能实现的 —— 这是一种出于善意的透明表态。但政府似乎正是以这一承认为框架,为其担忧找到了依据。如果透明承认自身局限会招来监管行动,而不透明则不会,那么行业将会得出相应结论。结果是公众获得的AI能力和风险信息将会减少 —— 这与安全倡导者多年来的追求恰恰相反。说白了:你越诚实,越可能被人抓住把柄。

结语:Fable的故事,讲了个寂寞

Fable,那个来自拉丁语「被讲述的故事」。这四天里,Fable 5确实被讲述了。只是没人料到,它自己才是这个故事里最短命的主角。96小时内,它完成了一次令人叹为观止的「成就解锁」:发布日万众瞩目,当天被誉为AI史上最强公开模型;第二天被曝「秘密降智」,Anthropic连夜道歉撤回;第三天微软宣布内部禁用,数据政策掀起企业端信任危机;第四天,美国政府一纸令下,全球强制下线。这是一个在封神和封禁之间,只隔了四天的故事。Anthropic目前正在争取尽快恢复访问。该公司表示认为存在误解,并正努力尽快恢复访问。它同时对Fable 5的安全防护架构保持信心,并指出没有任何测试者发现能够广泛绕过模型防护的通用越狱方法。但「Fable 5重新上线」的那个故事,暂时还没有被讲述。更深层的问题也悬而未决:当一个公司将自己最强大的产品公开发布,政府可以在72小时内以「国家安全」为由将其全球下线 —— 这条权力边界,今后每一家AI公司都必须纳入自己的发布风险模型。未来的AI发布,不只是技术问题,也是地缘政治问题。而Fable这个词的另一层含义,不应被遗忘:它也可以指「寓言」—— 一个带有道德教训的虚构故事。这一次的教训是什么,就留给读者自己去判断了。

http://www.cnnetsun.cn/news/2930401.html

相关文章:

  • 深入芯片内部:SkyEye仿真FT-M6678 DSP时,如何观察ReWorks任务调度与内存状态?
  • NLP动态知识切片系统:面向研究者的可编程领域感知基础设施
  • 假新闻检测实战:模型选型与超参数优化的工程化路径
  • 别再为vCenter HA网络配置头疼了!保姆级教程:从零配置管理网卡和HA私网VLAN
  • Hitboxer:终极游戏按键冲突优化工具,彻底解决SOCD问题
  • 开源罗技鼠标宏:3步掌握PUBG精准压枪技巧
  • 别小看这颗2.2nF电容!手把手教你排查MPU6050‘有ID无数据’的经典硬件故障
  • RK3588 Qt开发避坑实录:如何正确引入MPP、FFmpeg等SDK库到Qt5.12.10项目(附完整.pri配置)
  • 3步完成微信数据库本地解密:免费恢复聊天记录的完整指南
  • Spyder里报错‘No module named gurobipy’?别慌,手把手教你搞定Python环境与Gurobi的配置
  • InfluxDB Studio:Windows平台时间序列数据库图形化管理工具完整教程
  • Vivado里信号总被优化掉?试试DONT_TOUCH属性的正确打开方式(附代码对比)
  • 营业执照丢失怎么登报声明?营业执照丢失登报挂失的流程是什么?
  • N32G45X调试接口配置避坑指南:SWD模式、JTAG模式与IO释放的三种实战场景
  • 计算机毕业设计之网页小说阅读系统
  • 老师们试试录音AI,2026年讲座网课都能轻松整理
  • 专业音频解密解决方案:QMCDecode完全使用指南
  • 深入解析RePKG:如何构建稳定的Wallpaper Engine资源处理管道
  • 【粉丝福利社】计算机视觉:YOLO目标检测原理与实践
  • 4步构建你的游戏本地化系统:XUnity.AutoTranslator实战指南
  • HFSS仿真报错别慌!手把手教你搞定‘Acis error’、‘Local Machine’等5个高频错误
  • 告别LVDS!用JESD204B接口搞定高速ADC数据采集,实测Xilinx GT收发器配置
  • 多维聚合四大操纵范式:维度折叠、轴向旋转、粒度锚定与空间插值
  • 大模型推理的‘归零’革命:透明容错层如何抹除系统不确定性
  • 从无人机到平衡车:盘点那些让你调参调到头秃的PID实战场景与避坑指南
  • 从一次应急响应看致远OA wpsAssistServlet漏洞的利用与防御
  • 当CRM管理不再依赖IT排期,零代码正在改变什么?
  • MPC8379E内存控制器实战:eLBC与eSDHC接口配置与嵌入式存储驱动开发
  • 用图论指标解码城市街道网络:连通性、介数中心性与聚类系数实战指南
  • Gotify推送系统从安装到反向代理(NPM)的完整避坑指南,解决WebSocket连接和SSL验证问题