当前位置: 首页 > news >正文

AI动态简报之算力基建篇(2026.06.22)


⚡ 第1条:英伟达B200租赁价格暴涨94%,算力进入卖方市场

核心信息

2026年6月17日,AI推理基础设施服务商Baseten CEO披露,英伟达Blackwell架构主力推理GPU B200单卡每小时租赁单价将从当前的2.63上调至5.10,涨幅高达94%,现有合同10月到期后正式生效。与此同时,全球批量采购交付周期已拉长至12-15个月,千片级新订单全部顺延至2027年第二季度交付。

性能/价格对比

  • 当前租赁价:$2.63/小时/卡
  • 新租赁价:$5.10/小时/卡(10月生效)
  • 交付周期:从6-8个月拉长至12-15个月
  • 订单排期:新订单全部排至2027年Q2

对开发者/企业的影响

中小AI创业公司受冲击最为明显,自建算力周期过长、租赁成本大幅抬升,研发与商业化预算被迫压缩;头部厂商则加大长期锁卡力度,通过签订三年以上算力合约锁定成本,进一步加剧现货市场供给紧张。本轮算力紧缺预计至少持续至2027年末。

信息来源:搜狐/腾讯新闻/新浪财经 | 2026-06-17


⚡ 第2条:华为昇腾910C完成1.6万亿参数DeepSeek全参数训练,国产算力跨过最难门槛

核心信息

2026年6月5日,深圳河套学院AI训练平台联合哈工大(深圳)、深圳市大数据研究院、华为团队,依托昇腾910C国产AI算力集群,完成1.6万亿参数DeepSeek-V4-Pro全参数后训练。这是国产算力首次完成万亿级大模型全参数训练,标志着国产AI芯片从推理部署迈向复杂模型训练阶段。

性能/价格对比

  • 模型规模:1.6万亿参数(MoE架构)
  • 算力利用率:超过30%(工业级水平,海外顶级芯片约40%)
  • 训练算子效率:提升14%
  • 训练稳定性:1500多步训练全程零中断

对开发者/企业的影响

国产算力平台现已具备支撑世界级超大参数模型训练的能力,国内企业和科研机构可在国产算力上进行大模型训练,降低对海外GPU的依赖。同时,深圳河套学院已培养42名具备万亿级模型训练实战经验的学生,为国产AI产业储备人才。

信息来源:新浪科技/深圳发布 | 2026-06-07


⚡ 第3条:字节跳动拟采购5万颗国产AI芯片,国产替代升级为生产级刚需

核心信息

2026年6月18日,据媒体报道,字节跳动正与天数智芯洽谈采购至少5万颗AI推理芯片,主要用于豆包等产品的推理业务。若协议达成,天数智芯将成为继华为昇腾、寒武纪之后,字节跳动的第三家主要国产GPU供应商。字节跳动2026年AI基础设施资本开支预算已上调约25%至2000亿元。

性能/价格对比

  • 采购规模:至少5万颗AI推理芯片
  • 资本开支:2026年上调至2000亿元(较2025年增25%)
  • 豆包月活:3.45亿(QuestMobile数据,2026年3月)
  • 日均Token调用量:120万亿(较上线初期增长千倍)
  • 天数智芯定价:约为英伟达同级别产品的60-70%

对开发者/企业的影响

国产AI芯片正在从"政策采购、行业试点"真正进入互联网大厂的生产场景,从备选方案转向刚需算力支撑。推理场景对芯片的要求比训练更宽松,国产芯片在推理侧已达到可用水平,为大模型应用降本提供了现实路径。

信息来源:新浪财经/南华早报 | 2026-06-18


⚡ 第4条:壁仞科技完成20余款大模型Day-0适配,国产GPU生态飞轮启动

核心信息

2026年6月16-17日,智谱开源新一代旗舰模型GLM-5.2后,壁仞科技、摩尔线程相继宣布完成Day-0适配(模型发布当天即可运行)。壁仞科技壁砺166系列基于vLLM推理框架完成适配与调优,现已完成腾讯混元、阿里通义千问、DeepSeek全系、MiniMax M3、智谱GLM全系列、月之暗面Kimi等20余款国内头部大模型的Day-0级同步适配。

性能/价格对比

  • 适配模型数量:20余款头部大模型
  • DeepSeek适配速度:数小时完成(国产芯片记录)
  • 股价反应:壁仞科技官宣后当天股价上涨7.09%
  • 国家认证:2026年5月获国家最高安全可靠等级I级认证

对开发者/企业的影响

"Day-0适配"意味着芯片厂商的软件栈、工具链、开发者生态已成熟到可与模型发布同步。壁仞科技已和华为昇腾、寒武纪站到同一队列,国产GPU的生态"飞轮效应"正在形成:模型越多在国产芯片上跑,软件栈越成熟,新模型适配越快,更多模型厂商越愿意选择国产芯片。

信息来源:新浪财经 | 2026-06-17


⚡ 第5条:燧原科技科创板IPO过会,国产GPU四小龙首次齐聚资本市场

核心信息

2026年6月15日,燧原科技科创板IPO申请正式过会,拟募资60亿元。至此,"国产GPU四小龙"——摩尔线程、沐曦股份、壁仞科技、燧原科技,将首次在资本市场聚齐。燧原科技联合腾讯云发布"燎原"智算集群3.0商用版,已适配DeepSeek、腾讯混元、智谱AI等主流大模型,完成数千卡万卡集群部署。

性能/价格对比

  • 募资规模:60亿元
  • 已适配模型:DeepSeek、腾讯混元、智谱AI等主流大模型
  • 集群规模:数千卡万卡集群已部署
  • 股东背景:腾讯为第一大股东
  • 上市进展:摩尔线程(2026-01-02港股上市)、壁仞科技(2026-01-02港股上市)、沐曦股份(已过会)、燧原科技(2026-06-15过会)

对开发者/企业的影响

国产GPU四小龙齐聚资本市场,意味着国产算力芯片产业从技术攻坚阶段进入规模化商用阶段。资本助力将加速产品迭代和生态建设,为大模型企业提供更多算力选择和议价空间,推动AI算力成本下降。

信息来源:新浪财经/腾讯新闻 | 2026-06-15


📌 本简报由 英辰朗迪GEO整理

http://www.cnnetsun.cn/news/2987898.html

相关文章:

  • PrimeNG日历组件的动画问题与解决方案
  • i.MX53开发板实战:从Cortex-A8架构到嵌入式Linux多媒体应用开发
  • AI应用千人千面背后的动态策略引擎解析
  • 思源黑体:一站式解决多语言排版难题的终极方案
  • 嵌入式汇编开发环境变量配置全解析:从原理到实战避坑
  • lsyat门禁闸机删除人像数据—幽冥大陆(一百41)-东方仙盟
  • Qwen2.5-VL窗口注意力与绝对时间对齐原理深度解析
  • 如何利用AI驱动的浏览器自动化工具实现高效Web测试
  • JPEXS Free Flash Decompiler:拯救Flash数字遗产的终极免费工具
  • 矢量干涉整形技术:实现单次曝光无散斑全息显示的原理与实践
  • 实战指南:如何用Video2X将模糊视频无损放大到4K画质
  • 从零构建自动化渗透测试框架:Python实现核心架构与模块实战
  • CPO++:通过反事实解耦增强多模态大模型推理鲁棒性
  • AI编程工作流设计:从编辑器选择到协同协议落地
  • 求职时间革命:Boss Show Time插件终极指南,让招聘信息不再错过
  • 嵌入式寄存器编程实战:从古董扩展卡到现代SoC的地址映射与驱动设计
  • Chrome画中画扩展终极指南:免费实现多任务视频悬浮播放
  • Windows系统文件D3DCompiler_47.dll丢失找不到问题解决
  • 魔兽世界API开发:3个实用功能让你告别宏命令烦恼的终极指南
  • 技术深度解析:Android TTS Server语音规则引擎的架构设计与高级应用
  • FrankenPHP在信创环境下的适配
  • 5步掌握Unlock Music:浏览器端音频解密终极指南
  • Switch手柄PC终极适配指南:用BetterJoy免费解锁任天堂手柄完整功能
  • 第27章:大文件与长文档处理——从摘要到问答
  • 零成本打造专业级直播录制:OBS Studio完全指南
  • 3分钟搞定Windows系统管理:WinUtil一站式优化工具完全指南
  • 嵌入式开发环境变量深度解析:从原理到CodeWarrior实战配置
  • 2026年裸眼3D制作公司深度评测:从技术选型到地标落地,谁真正驾驭了“破屏而出“的视觉革命?
  • 「简记往来」开发历程系列:数据结构——如何设计收礼和送礼的双向关系
  • Qwen A3B:3B激活实现35B性能的MoE端侧AI架构