当前位置：首页 > news >正文

H200一夜涨30%，AI的便宜时代结束了

news 2026/6/4 1:29:35

H200一夜涨了30%，H100全球断货，连Karpathy这种顶配资源的研究者都在抱怨配额不够。与此同时，微软内部发现烧Token的成本已经超过了直接雇人写代码——两个信号叠在一起，指向同一个结论：AI的便宜时代，快要结束了。

🎯 这不是涨价，是信号

2026年5月，硅谷最焦虑的不是"AI能不能做到"，而是"用不用得起"。

H200一夜涨了30%。这不是市场波动，是供需撕裂。H100早在几个月前就已经全球断货，云厂商的配额制让大部分人连排队的机会都没有。

但真正值得关注的不是H200涨了多少，而是连Karpathy在抱怨配额不够。当圈子里最有资源的人都在喊缺，说明供给端的结构性问题已经不只是"紧张"，而是系统性危机。

这事得放到更大的背景下来看。

英伟达的产能不是说扩就扩的。台积电CoWoS封装产能的扩充周期在12-18个月，即便是最乐观的预测，2026年下半年之前也看不到有效缓解。与此同时，每一波大模型升级都在消耗更多的算力——GPT-5的训练成本据传是GPT-4的10倍以上，推理阶段的算力需求更是指数级增长。

供给和需求之间的剪刀差，正在加速拉开。

⚙️ 微软的数据，比Karpathy的抱怨更可怕

Karpathy抢不到卡是个体困境，微软的数据才是系统级警报。

微软内部做了一件事——把Token成本拆到每个工程师头上。算完发现一个让他们睡不着觉的数字：烧Token的成本，已经超过了直接雇人写代码的薪资。

这个数据直接导致微软悄悄踩了vibe coding的刹车。不是不做了，是要重新算投入产出比。

Copilot创始工程师Neel Sundaresan更是辛辣：大多数AI编码"就像开着法拉利去买牛奶"。能力强，但用错了地方，效率反而更低。

这两件事放在一起，说明一个道理：当行业巨头都在喊贵的时候，就不是小公司的问题了——是这个行业的商业模式有问题。

🏗️ 成本结构正在决定技术路线

GPU短缺和Token涨价，正在倒逼整个行业做出选择。

第一条路：硬扛成本。继续烧钱，等供给端跟上。但问题是没有人知道什么时候才能跟上。2025年大家都在赌"明年会缓解"，2026年大家发现"明年会更糟"。

第二条路：优化效率。这其实已经在发生了。ClickHouse团队用了一年AI编码后，总结出了非常诚实的经验——哪些任务适合用AI，哪些不适合。核心结论是：不要为了用AI而用AI，找到对的场景比堆Token重要得多。

第三条路：改变范式。Anthropic推出MCP隧道，让私有Agent可以安全访问企业内网，本质上是在降低Agent落地的门槛。门槛降低了，Token的使用效率就能提高。这条路是最有前景的，但也最难——需要整个基础设施层的大改造。

从Grab的实践案例来看，他们已经开始这么做了。中央数据团队搭建了多智能体系统，把自动化工作分成两类：自动执行的，和需要人工确认的。这种分层设计，本质上就是在成本可控的范围内最大化AI的价值。

✅ 谁在赚，谁在亏

谁在亏：

盲目堆算力的创业公司——最容易被成本压垮
依赖单一云厂商GPU的团队——涨价毫无议价权
不做成本核算的AI研究者——资源配额随时可能被砍

谁在赚：

算力优化赛道——DeepSeek的量化和蒸馏路线估值暴涨
AI基础设施监控——Agent越来越多，谁来监控它们成了新机会
Node-based MCP和Agent编排——降低使用成本就是创造价值

💡 写在最后

2026年5月的硅谷，AI行业正站在一个十字路口：一边是继续烧钱等供给缓解，一边是逼着自己把每一分Token都用在刀刃上。

这个选择无关对错，只关乎你想活多久。

对于团队来说，现在最该做的不是追AI能力的上限，而是算清楚自己的成本底线。ClickHouse团队说得好：AI是个好工具，但用对场景的人才能活到下个周期。

觉得有启发？点个在看🎯
关注我，不错过AI行业的真信号

参考资料

[1] 硅谷深陷算力荒：H200一夜涨价30%，H100抢到缺货，Karpathy也未能幸免: https://mp.weixin.qq.com/s?__biz=MjM5MDE0Mjc4MA==&mid=2651285214&idx=1&sn=2a56c4c18ce8de4a44d10a4b9b0ca2bb
[2] 微软按下 vibe coding 暂停键：烧 token 已经比员工贵了: https://mp.weixin.qq.com/s?__biz=MTMwNDMwODQ0MQ==&mid=2653107181&idx=1&sn=58fc8abc6447f864db5b2675f085910b
[3] What ClickHouse learned from a year of coding with AI agents: https://thenewstack.io/clickhouse-ai-coding-agents/
[4] Copilot 创始工程师：大多数 AI 编码就像开着法拉利去买牛奶: https://mp.weixin.qq.com/s?__biz=MjM5MDE0Mjc4MA==&mid=2651285633&idx=2&sn=a79ef03e7c871dfdff0e8093d9fe9504
[5] Anthropic 推出 MCP 隧道，供私有代理访问内部系统: https://mp.weixin.qq.com/s?__biz=MjM5MDE0Mjc4MA==&mid=2651285633&idx=4&sn=8d615360a54bf818f7a3b4ff4f426110
[6] 大规模工程支撑场景下的多智能体系统设计：Grab 实践案例: https://mp.weixin.qq.com/s?__biz=MjM5MDE0Mjc4MA==&mid=2651285633&idx=3&sn=97076f465c8b7eb3be988b414327cadd
[7] Who’s monitoring the agents?: https://thenewstack.io/who-monitors-ai-agents/

查看全文

http://www.cnnetsun.cn/news/2572564.html