Claude 断供之后,我的代码是怎么跑起来的
这个月初,Anthropic 发布了 Claude Fable 5,SWE-Pro 编程基准 80.3%,整个 AI 圈都在刷"神话级"。6 月 12 号下午 5 点 21 分,美国商务部一纸出口管制令,Fable 5 从全球所有 API 端点同时消失。
从巅峰到下架,76 小时。
这件事的影响远不止"少了一个模型可选"。它暴露了一个很多人之前刻意回避的问题:你的开发工具链,能不能在主力模型断供之后继续跑?
如果你的答案不确定,这篇文章是写给你的。
1. 不是"模型没了",是工作流断了
先说清楚 Fable 5 断供到底影响了谁。
如果你只是偶尔用 Claude 网页版聊天,影响不大——Opus 4.8、Sonnet 4 还在。但如果你把 Claude 接进了开发工作流,情况完全不同:
- Claude Code 里配的 API Key,调的是 Fable 5/Opus 4.8,断供当天所有依赖 Claude 的自动代码生成任务直接停摆
- 基于 Claude API 做的自动化 Pipeline(代码审查、文档生成、测试用例),所有请求返回 404
- Amazon Bedrock 上的 Claude 实例,AWS 官方公告确认已全部撤销
这不是"某个模型变贵了"或者"响应变慢了"。这是你代码里那行model="claude-fable-5"突然变成了一个不存在的东西。
我身边有团队因为工单系统里的 AI 自动分类功能绑在 Claude API 上,断供当天直接回到了人工分类——日均 3000 条工单,两个运营熬到凌晨两点。
这就是第一个教训:工具链绑在单一模型上,等于把业务连续性交给了一纸行政令。
2. 国产模型能接住吗?实战结论
断供消息出来那天,我做了一件事:把手里一个基于 Claude 的项目完整迁移到国产模型上,看看到底能不能跑。
项目背景是一个内部代码审查工具,逻辑不复杂——读取 Git Diff,逐文件分析潜在问题,输出 Markdown 格式的 Review 报告。原来跑在 Claude Opus 4.8 上,日均处理 200+ 个 PR。
迁移目标选了三个国产模型做对比测试:
| 模型 | 编程基准得分 | API 兼容性 | 迁移工作量 |
|---|---|---|---|
| DeepSeek V4-Pro | SWE-bench 67.3% | OpenAI 兼容 | 改 model 参数即可 |
| Qwen 3.7 Max | HumanEval 95.2% | OpenAI 兼容 | 改 model 参数即可 |
| Kimi K2.7 Code | HumanEval 96.1% | OpenAI 兼容 | 改 model 参数即可 |
| GLM-5.2 | SWE-bench 58.1% | 需适配 SDK | 改调用方式 |
好消息是:国内主流模型都兼容 OpenAI API 格式。如果你的代码是标准openai库调法,切换成本低到只需要改两行——Base URL 和 model 参数。
坏消息是:能力上有差距。Fable 5 被禁之前的编程能力确实是独一档的。DeepSeek V4-Pro 降价 75% 后我的代码审查任务能跑,但复杂逻辑的 Review 准确率从原来的 ~85% 降到了 ~75%。Qwen 3.7 Max 在代码生成上追得很近,但遇到需要跨文件理解上下文的场景时明显吃力。
差距在缩小,但还没消失。
3. 实际的迁移步骤
说"换个 model 参数就行"太轻飘飘了。实际迁移过程比这复杂,踩了三个坑:
坑一:Prompt 不通用。同一个 Prompt,Claude 能理解你的意图,国产模型不一定。尤其是带嵌套指令的长 Prompt——“你先分析这段代码的结构,然后找出潜在的性能问题,最后用表格形式输出”——Claude 处理这种多层指令很稳,换到 Kimi K2.7 后经常只执行了第一条指令就停了。
解决方式:把长指令拆成多轮对话,每轮只给一个明确任务。Prompt 复杂度上去了,但可靠性也上去了。
坑二:输出格式不稳定。我原来的系统要求 Claude 输出 JSON 格式的 Review 结果。切到 DeepSeek 后,时不时给你在 JSON 外面包一段自然语言:“好的,这是分析结果:{…}”。解析器直接崩。
解决方式:用 LangChain 的StructuredOutputParser加了一层校验,非 JSON 输出自动重试。多绕了一层,但 3 天下来错误率降到了零。
坑三:Token 消耗不同。Claude 4.8 一个 PR Review 平均消耗 800-1200 Token。DeepSeek V4-Pro 同样的任务跑到 1500-1800 Token——不是模型差,是它的思考过程更长、输出更细。月初没注意这点,Token 消耗预算直接超了 40%。
解决方式:加了max_tokens限制和 Flash 档位分流——对简单文件用 DeepSeek V4-Flash,复杂文件用 DeepSeek V4-Pro,把总消耗压回了预算内。
这些坑都不是"换一个 API Key"能解决的。但好消息是,踩过一次之后,你的系统就不再绑死在任何一个模型上了。
4. 编程工具怎么切?实测三条路线
很多人不是直接调 API,而是通过 Claude Code 这样的工具。断供后 Claude Code 官方虽然还能用 Opus 4.8,但 Fable 5 没了,体验降了一个台阶。
我实测了三条切换路线:
路线一:Claude Code → Cline。Cline 支持任意 OpenAI 兼容 API,直接配 DeepSeek V4-Pro 的 Base URL 就能跑。配置文件一个 JSON 搞定。缺点是没有 Claude Code 的 MCP 生态,但核心的代码编辑、文件操作、终端执行功能都在。
实测感受:日常编码任务(写函数、改 Bug、加注释),Cline + DeepSeek V4-Pro 的效率大约是之前 Claude Code + Fable 5 的 75%。能干活,但没有惊喜。
路线二:Claude Code → Aider。Aider 的卖点是 Agent 模式——自动规划、自动执行、自动验证。配 Qwen 3.7 Max 后,简单的全栈开发任务几乎无感切换。但遇到大型重构时,Qwen 的上下文理解能力明显不如 Fable 5,生成的代码需要更多人工修正。
路线三:保留 Claude Code,接国产 API。Claude Code 其实支持自定义 API 端点。如果你的团队已经深度依赖 Claude Code 的 MCP 生态和 Workflow,可以把后端模型换成兼容 OpenAI 格式的国产模型。GLM-5.2 提供了一个兼容适配层,实测能跑但偶有 protocol 不兼容的问题。
结论:不赌一个。我现在的工作流是 Cline + Aider 双持,Cline 跑 DeepSeek V4-Pro 做日常编码,Aider 跑 Qwen 3.7 Max 做架构级任务。哪个工具适合哪个任务,就用哪个。AI应用开发多模型切换方案的核心不在于"找到最好的那个",而在于"不依赖任何一个"。
5. 最重要的不是换模型,是换脑子
Fable 5 断供事件给我的最大冲击不是技术层面的。技术问题都有解法。
真正被颠覆的,是之前那种"赌一个最强模型"的心态。
过去两年,AI 圈的默认操作是:哪个模型最强,就把全部工作流压上去。Claude 编程最强 → Claude Code 全家桶。GPT 推理最强 → OpenAI API 全上。这个逻辑在"模型只会越来越强"的假设下成立,但在"模型可能随时消失"的现实里站不住。
大模型API快速接入这件事,本质上不是技术问题,是架构选择。你的代码里不应该出现model="claude-fable-5",而应该是一个可配置的模型名。不应该 import 某个模型的专属 SDK,而应该走 OpenAI 兼容的通用接口。
器灵模型广场这种统一接入平台,解决的就是这个问题:你不需要为每个模型维护一套接入代码。一个 Base URL,一个 API Key,model 参数就是你的切换开关。今天 DeepSeek 崩了切千问,明天 Claude 回来了切回去——代码不需要动。
Fable 5 断供大概率不会是最后一次。它不是 Anthropic 的问题,是整个 AI 供应链正在被地缘政治切割的信号。加拿大总理卡尼在事件后说了一句话:“如果我们只是接受现状,不从中吸取教训,不去拓展和多样化我们的 AI 供应链,那才是真正的错误。”
这句话不止是说给政府听的。
下次选模型的时候,除了看跑分,记得多问自己一句:这个模型,能不能随时换掉?
