当前位置: 首页 > news >正文

OpenAI 突然开源了一个“只有 0.4B 参数”的模型——

OpenAI 突然开源了一个“只有 0.4B 参数”的模型——

但它的 99.9% 权重都是 0。

是的,你没看错。
这个叫Circuit Sparsity的新模型,仅靠 0.1% 的活跃连接,就完成了传统稠密模型需要数十亿参数才能做的任务。

更惊人的是:

  • 它的推理路径像电路图一样清晰——每一条激活通路都可追溯;
  • 移除任意一个关键节点,任务立刻失效,能力与结构强绑定
  • 推理速度极快,资源消耗近乎为零,特别适合边缘设备或高并发场景。

OpenAI 说,这是他们探索“可解释 AI”的关键一步。

但作为开发者,我看到的却是另一个现实:

这种新型稀疏架构,和 GPT-5、Gemini、Claude、Mistral、GLM……完全不是一个物种。

它的 API 格式不同,token 计算逻辑不同,甚至“输入-输出”行为都更接近符号系统而非概率生成。

如果你现在想试试它?恭喜,你又要写一套全新的适配层。


而我?我只改了一行配置。

因为在Gateone.AI,Circuit Sparsity 从上线第一天起,就被纳入了统一智能路由体系

Python

编辑

# 切换模型?只需改 model 名 response = gateone.chat.completions.create( model="openai/circuit-sparsity", # 或 "gpt-5.2", "gemini-3-deepthink", "glm-4-6v" messages=[{"role": "user", "content": "解释量子隧穿效应"}] )

自动处理稀疏模型的特殊输入格式—— 无需研究其“电路激活协议”;
统一输出结构—— 无论底层是稠密、MoE、还是稀疏架构,返回格式一致;
A/B 测试超简单—— 对比 Circuit Sparsity 的可解释性 vs. GPT-5.2 的流畅性,数据秒出;
成本几乎为零—— 因其极低计算开销,调用费用趋近于免费,Gateone 自动优先调度它用于轻量任务;
未来兼容无忧—— 下次 OpenAI 发布“量子稀疏”或“神经符号混合体”,我们照样无缝接入。


稀疏模型不是替代大模型,而是补齐 AI 工具箱的最后一块拼图。

  • 高风险决策?用 Circuit Sparsity,路径可审计;
  • 实时边缘推理?用它,省电又快;
  • 教学/研究?它是绝佳的“白盒 AI”范例。

但前提是——你得能轻松用上它,而不是被集成复杂度劝退。


Gateone.AI 的使命,从来不是“聚合更多模型”,

而是让每一种 AI 范式,都为你所用,而不为你所累。

无论是 675B 的 Mistral Large 3,
还是 0.4B 的 Circuit Sparsity,
在 Gateone 看来,都是你工具箱里的一把刀——
你只管选,我们负责磨好、递到你手上。


🎁新用户注册即送 $2 体验额度(无需绑卡)
🔬 Circuit Sparsity 已上线 Gateone 平台,支持即时调用与对比实验
🔗 立即体验下一代 AI 范式的自由:https://gateone.ai

当世界在分裂成“稠密派”和“稀疏派”,
我们选择做那个连接所有可能的人

http://www.cnnetsun.cn/news/95892.html

相关文章:

  • vue基于Springboot框架实现新能源汽车4s店销售管理系统
  • 开关频率可调的永磁同步电机svpwm发电仿真模型,可调稳定发电电压,负载,母线电容可调,可用于...
  • C语言高阶玩法:函数指针与回调函数实战指南,让你的代码拥有“灵魂”
  • 基于SpringBoot的校园二手书交易平台的设计与实现
  • 数据结构与算法--007三数之和(medium)
  • C++ 模板初阶:泛型编程的入门指南
  • 基于Java实现优雅关闭的规范化方案设计与实现
  • 时序数据战场巅峰对决:金仓数据库 VS InfluxDB深度解析
  • Windows任务管理器中CPU相关指标怎么看?
  • 【必藏】大模型入行晚了?现在就是黄金时机!小白到入门的完整路线
  • 系统思考与认知习惯
  • 速藏!2026年免费免版权音乐素材网站推荐!正规版权保障,商用无压力不侵权
  • 【数据分享】1951-2024年我国省市县三级逐日、逐月和逐年近地面气温数据(Shp/Excel格式)
  • 金融行业广告投放:在合规的赛道上,实现精准增长
  • 长安汽车11月销量28.3万辆,同比增长2.3%
  • 1688 商品详情接口深度解析:从百川签名突破到供应链数据重构
  • LobeChat心理情绪日记分析工具
  • 一文搞懂纸老虎-布隆过滤器
  • LobeChat周年庆感恩回馈活动
  • 运维系列数据库系列【仅供参考】:DM JOB作业的邮件发送
  • 当AI面临伦理投诉时,AI应用架构师该怎么办?这5个解决步骤
  • 主存编址是什么
  • Python 整合 Redis 哨兵(Sentinel)与集群(Cluster)实战指南
  • HLS技术的局限性说明
  • 水文监测站:水资源管理的“千里眼”与“顺风耳”
  • 白银波动幅度大于黄金的原因:市场规模与属性差异深度解析
  • 【2026版】Spring Boot面试题
  • 办公小程序开发----提高工作效率
  • Jmeter 命令行压测生成HTML测试报告
  • AI编程系列——mcp与skill