当前位置: 首页 > news >正文

H200一夜涨30%,AI的便宜时代结束了

H200一夜涨了30%,H100全球断货,连Karpathy这种顶配资源的研究者都在抱怨配额不够。与此同时,微软内部发现烧Token的成本已经超过了直接雇人写代码——两个信号叠在一起,指向同一个结论:AI的便宜时代,快要结束了。


🎯 这不是涨价,是信号

2026年5月,硅谷最焦虑的不是"AI能不能做到",而是"用不用得起"。

H200一夜涨了30%。这不是市场波动,是供需撕裂。H100早在几个月前就已经全球断货,云厂商的配额制让大部分人连排队的机会都没有。

但真正值得关注的不是H200涨了多少,而是连Karpathy在抱怨配额不够。当圈子里最有资源的人都在喊缺,说明供给端的结构性问题已经不只是"紧张",而是系统性危机。

这事得放到更大的背景下来看。

英伟达的产能不是说扩就扩的。台积电CoWoS封装产能的扩充周期在12-18个月,即便是最乐观的预测,2026年下半年之前也看不到有效缓解。与此同时,每一波大模型升级都在消耗更多的算力——GPT-5的训练成本据传是GPT-4的10倍以上,推理阶段的算力需求更是指数级增长。

供给和需求之间的剪刀差,正在加速拉开。


⚙️ 微软的数据,比Karpathy的抱怨更可怕

Karpathy抢不到卡是个体困境,微软的数据才是系统级警报。

微软内部做了一件事——把Token成本拆到每个工程师头上。算完发现一个让他们睡不着觉的数字:烧Token的成本,已经超过了直接雇人写代码的薪资。

这个数据直接导致微软悄悄踩了vibe coding的刹车。不是不做了,是要重新算投入产出比。

Copilot创始工程师Neel Sundaresan更是辛辣:大多数AI编码"就像开着法拉利去买牛奶"。能力强,但用错了地方,效率反而更低。

这两件事放在一起,说明一个道理:当行业巨头都在喊贵的时候,就不是小公司的问题了——是这个行业的商业模式有问题。


🏗️ 成本结构正在决定技术路线

GPU短缺和Token涨价,正在倒逼整个行业做出选择。

第一条路:硬扛成本。继续烧钱,等供给端跟上。但问题是没有人知道什么时候才能跟上。2025年大家都在赌"明年会缓解",2026年大家发现"明年会更糟"。

第二条路:优化效率。这其实已经在发生了。ClickHouse团队用了一年AI编码后,总结出了非常诚实的经验——哪些任务适合用AI,哪些不适合。核心结论是:不要为了用AI而用AI,找到对的场景比堆Token重要得多。

第三条路:改变范式。Anthropic推出MCP隧道,让私有Agent可以安全访问企业内网,本质上是在降低Agent落地的门槛。门槛降低了,Token的使用效率就能提高。这条路是最有前景的,但也最难——需要整个基础设施层的大改造。

从Grab的实践案例来看,他们已经开始这么做了。中央数据团队搭建了多智能体系统,把自动化工作分成两类:自动执行的,和需要人工确认的。这种分层设计,本质上就是在成本可控的范围内最大化AI的价值。


✅ 谁在赚,谁在亏

谁在亏:

  • 盲目堆算力的创业公司——最容易被成本压垮
  • 依赖单一云厂商GPU的团队——涨价毫无议价权
  • 不做成本核算的AI研究者——资源配额随时可能被砍

谁在赚:

  • 算力优化赛道——DeepSeek的量化和蒸馏路线估值暴涨
  • AI基础设施监控——Agent越来越多,谁来监控它们成了新机会
  • Node-based MCP和Agent编排——降低使用成本就是创造价值

💡 写在最后

2026年5月的硅谷,AI行业正站在一个十字路口:一边是继续烧钱等供给缓解,一边是逼着自己把每一分Token都用在刀刃上。

这个选择无关对错,只关乎你想活多久。

对于团队来说,现在最该做的不是追AI能力的上限,而是算清楚自己的成本底线。ClickHouse团队说得好:AI是个好工具,但用对场景的人才能活到下个周期。

觉得有启发?点个在看🎯
关注我,不错过AI行业的真信号


参考资料

[1] 硅谷深陷算力荒:H200一夜涨价30%,H100抢到缺货,Karpathy也未能幸免: https://mp.weixin.qq.com/s?__biz=MjM5MDE0Mjc4MA==&mid=2651285214&idx=1&sn=2a56c4c18ce8de4a44d10a4b9b0ca2bb
[2] 微软按下 vibe coding 暂停键:烧 token 已经比员工贵了: https://mp.weixin.qq.com/s?__biz=MTMwNDMwODQ0MQ==&mid=2653107181&idx=1&sn=58fc8abc6447f864db5b2675f085910b
[3] What ClickHouse learned from a year of coding with AI agents: https://thenewstack.io/clickhouse-ai-coding-agents/
[4] Copilot 创始工程师:大多数 AI 编码就像开着法拉利去买牛奶: https://mp.weixin.qq.com/s?__biz=MjM5MDE0Mjc4MA==&mid=2651285633&idx=2&sn=a79ef03e7c871dfdff0e8093d9fe9504
[5] Anthropic 推出 MCP 隧道,供私有代理访问内部系统: https://mp.weixin.qq.com/s?__biz=MjM5MDE0Mjc4MA==&mid=2651285633&idx=4&sn=8d615360a54bf818f7a3b4ff4f426110
[6] 大规模工程支撑场景下的多智能体系统设计:Grab 实践案例: https://mp.weixin.qq.com/s?__biz=MjM5MDE0Mjc4MA==&mid=2651285633&idx=3&sn=97076f465c8b7eb3be988b414327cadd
[7] Who’s monitoring the agents?: https://thenewstack.io/who-monitors-ai-agents/

http://www.cnnetsun.cn/news/2572564.html

相关文章:

  • Tomcat管理后台渗透:权限模型、War部署与Shell执行全链路解析
  • LLaMA-Mesh:文本生成可导入Blender的OBJ网格模型
  • Arduino_GFX性能优化秘籍:如何让你的显示效果提升300%
  • beeplay源码解析:put()与start()方法如何驱动音乐播放流程
  • 如何在iOS应用中快速集成DZNWebViewController:5分钟入门教程
  • QMCFLAC音频格式转换工具:3步解决QQ音乐加密文件播放限制
  • 实战指南:在Windows环境下精准测量WiFi RSSI信号强度
  • 车载以太网安全与深度学习模型压缩技术实践
  • 从‘飞鸟’到‘抛物’:我是如何用OpenCV+SORT优化高空抛物误报率的(附参数调试心得)
  • LDDC跨平台部署指南:在Windows、macOS和Linux上安装与配置
  • cxxnet迁移指南:3个简单步骤将现有模型无缝转换至MXNet的终极教程
  • 动力电池系统解析(二)——BMS软硬件架构设计与选型考量
  • iCraft Editor终极指南:如何轻松创建惊艳的3D架构图
  • 图像矢量化终极指南:如何使用vectorizer将PNG/JPG转换为SVG
  • 猫抓浏览器扩展:现代网页媒体资源捕获的终极解决方案
  • 基于C#实现(WinForm)求解SIN(X)数值分析
  • 前端首屏全链路性能优化:从诊断到落地的完整实践
  • SSH指定端口和用户名:保障远程连接可预期、可审计、可复现
  • 进阶篇-LangChain篇-29--后LangChain时代:AI工程师的演进之路
  • 告别重复劳动:Pulover‘s Macro Creator如何让Windows自动化变得简单高效
  • 6G前传接口与O-RAN/openRAN:探索未来通信的新路径
  • AI Agent安全实战:从OWASP Top 10风险到分层加固方案
  • Excel冻结窗格:长表格浏览的视觉锚点与效率开关
  • Deepseek MLA CP通信AlltoAll
  • 应用层协议http
  • 番茄小说下载器终极指南:轻松获取EPUB、TXT和有声小说
  • 统信UOS也能本地跑AI语音合成!MOSS-TTS-Nano部署实测全流程
  • Jmeter性能测试进阶:巧用多线程组设计,解决‘集合点’搞不定的定时与隔离难题
  • GRaD-Nav++:基于视觉语言模型的无人机自主导航系统
  • 实验报告(一)