当前位置: 首页 > news >正文

MEET 2026 | 荣获双奖,AI 开源点亮智能未来

12 月 10 日,以「共生无界,智启未来」为主题的 MEET 2026 智能未来大会在北京举行。承袭 MEET 系列年度行业观察的视角,聚焦以 AI 为代表的智能科技如何穿透产业、学科与场景边界,探讨前沿技术进展与产业落地新动向。

大会邀请清华大学智能产业研究院院长张亚勤、人工智能研究院常务副院长孙茂松等二十余位来自智能科技产业、科研领域的行业领袖与专家,共同交流前沿观点、碰撞思维火花,共论行业破局之道,洞见智能新未来。

小米集团首席语音科学家 Daniel Povey 博士受邀出席,并发表题为《The Evolution of AI —— Lessons from evolution for the future of AI development》的主题演讲。大会现场还权威发布「2025 人工智能年度榜单」,小米集团获“2025人工智能年度领航企业”。

与此同时,本届大会聚焦人工智能在不同行业与场景中的典型应用,评选出在创新性、落地性和行业推动力方面表现突出的 AI 解决方案。在此背景下,“小米汽车全域质量多智能体引擎解决方案”凭借其在数据问答、智能诊断方面的卓越表现,荣获「2025 人工智能年度杰出解决方案」 奖。



01

AI进化论

在开源协作中加速智能涌现


大会上,Daniel Povey 博士创新性地将 AI 数十年的发展历程与生物进化规律相类比,深刻剖析 AI 技术演进的核心逻辑。他认为正如生物进化依赖细胞的分裂与复制,AI 能力的演进同样建立在一代又一代可复现的基线系统之上。在不断的试错与迭代中,新的模型被“筛选”出来,推动能力边界向前拓展。

同时,生物进化受生态环境反馈所制约,AI 的发展也依赖并受到诸多外部因素的影响,例如算力、数据规模与质量等,而 AI 能力本身产生的可供性,又会反过来改变其所处的外部环境,为技术生态和信息环境带来新的可能。

然而,生物进化曾经历漫长的停滞期,甚至发生“大氧化事件”式的断崖式变化。类似地,AI 的能力演进也可能陷入瓶颈,甚至走入“死胡同”,出现阶段性的沉寂。但与随机性的生物演化不同,AI 的演进在本质上由人类主导,其中蕴含着人类的理性、创造力与方向性。

因此,我们可以通过多种方式促进其持续突破:不断注入更坚实的数理知识体系,推动开源运动与开源软件生态,探索跨任务与跨学科的融合路径,保持对新模型架构的开放与好奇,在通用模型与专用模型之间做出审慎权衡,并通过更深入的理解与更智慧的调试来驱动整体能力的进步。

Daniel Povey 博士还介绍了小米在 AI 方面的实践战略——技术深耕与产品赋能双轮驱动。一方面,小米致力于将 AI 技术全面落地小米高端产品中,2025年 AI 相关研发投入占比达四分之一,通过 AI 全面赋能“人车家全生态”,不仅大幅提升了用户体验,更激发了整个生态的活力。

另一方面,小米同样大力投入技术预研,小米 AI 实验室在 AI 赋能智能制造、能耗优化和材料研制等方向取得突破性进展。其中,泰坦合金的成功研制正是“AI for Science”战略的里程碑成果,并直接支撑了小米 SU7 超级大压铸技术的落地,这种从基础科研到产品应用的闭环创新正是小米 AI 战略的核心竞争力所在。

拥抱开源,从 Zipformer 到 Zapformer

Daniel Povey 博士在演讲中重点强调了开源对于 AI 技术发展的重要性,他指出:正如进化可能陷入“局部最优”,AI 发展同样面临停滞风险;而人类理性的介入,让我们能够克服进化的随机性,主动引领技术方向。这一洞见,指引了小米在 AI 领域的实践路径,而开源正是小米将这一理念付诸实践的核心动力。

小米坚信,只有深耕底层技术,才能为上层应用提供坚实可靠的“冰山基座”。用户所能感知的应用界面,如同露出海面的冰峰;而强有力托起这一切的,正是隐藏在海面之下的庞大技术基底。以小米的小爱同学为例,每一次准确、高效的语音交互,都离不开底层硬核技术的坚实支撑。

其中,由“Kaldi之父” Daniel Povey 博士在小米主导的新一代 Kaldi 项目,正是这一理念的杰出体现与核心实践。 作为攻坚底层、构建“技术基底”的明星开源项目,Daniel 博士早在2019年便洞察到 Transformer 架构与通用基础模型的潜力。加入小米后,他正式启动了这一蓝图,致力于从声学编码器、损失函数、优化器到解码器进行全链路重构,打造新一代语音基础引擎。这不仅是为了提升智能语音任务的准确率与效率,其通用方法论更旨在赋能更广泛的 AI 领域。

从刷新纪录的 Zipformer 到定义未来的 Zapformer,新一代 Kaldi 持续引领底层突破。2024年,团队推出的 Zipformer 语音编码器,凭借创新的采样机制和 ScaledAdam 优化器,在语音识别任务中刷新多项国际纪录。今年,团队又带来了全新升级的、更具前瞻性的 Zapformer 通用声音基座。

从 Zipformer 到 Zapformer,我们实现了三大跨越:

  • 从“人声”到“万声”的跨越:从专注于人声建模,到成为能同时理解人声、环境音等多元信息的通用声音基座;

  • 从优化结构到创新理论的跨越:通过引入 Daniel 提出的原创梯度流(Gradient Flow)理论指导模型设计,在已属业界标杆的 Zipformer 基础上,将语音识别精度再次显著提升10%-15%;

  • 从专用优化到通用健壮的跨越:为适应海量数据训练移除了 Dropout 层,增强了大数据拟合能力,同时将优化器升级为 TransformAdam,在保持极速收敛的同时,大幅提升了训练的通用性与稳定性。

这些跨越,共同构成了 Zapformer 重新定义通用声音基座能力边界的硬核实力。

小米始终秉持“站在巨人的肩膀上,也给巨人指方向”的理念,坚信只有开放的协作,才能最大程度地加速智能时代的真正到来。据不完全统计,2025年小米新增的开源的项目就多达 30 余个,其中不乏像 Miloco,MiDashengLM,Zipvoice 等得到社区热烈追捧的明星项目。Zapformer 这一突破性成果,也会在开源社区完整释放,敬请期待。


02
小米汽车全域质量

多智能体引擎解决方案

随着第50万辆整车在北京亦庄超级工厂正式下线,小米汽车迎来了一个新的规模化阶段。为了能够更及时、更可靠地解答用户问题,促进小米汽车质量迭代优化,推出小米汽车全域质量多智能体引擎解决方案(以下简称:解决方案)。解决方案核心通过以 AI 赋能小米汽车质量检测,贯穿研、产、供、销、服全生命周期,以数据问答、智能诊断、8D 报告一键生成,打造“发现-分析-解决-预防”质量业务闭环,让质量决策秒级完成、缺陷归零快人一步。

数字分身:AI辅助下的数据问答

小米汽车全域质量多智能体引擎解决方案团队推出业界首个深度融合 FAS/HAS 双阶段 Agent 架构的质量工程师数字分身,超越了简单的问答工具,支持数据问答、自然语言交互、多轮对话、图表生成、8D 报告一键生成等能力,将汽车质量工程从经验驱动推向智能涌现时代,复杂主题分析耗时从周级别压缩至分钟级。

通过将海量小米领域数据嵌入开源基座中,智能整合覆盖从研发设计→生产制造→供应链→销售交付→售后服务完整链路的结构化数据资产,形成整车全生命周期数据闭环,原本分散在研、产、供、销、服各域的“数据点”转化为“知识链”,对汽车出现的质量问题做到更迅速、更准确的响应。基于此,解决方案的最终目标是能够实现:当车辆出现故障现象时,其根因可追溯至设计缺陷、供应商零件或生产工艺的全局分析,而非单点解决。

解决方案以汽车领域知识大模型为底座,突破传统数据孤岛,实现自然语言精准查询。通过 NL2SQL 和智能意图识别,攻克自然语言到复杂查询的转化难题 ,精准理解质量工程师的模糊业务提问 ,自动规划跨系统(MES、SQMS、DMS、QMS等)的数据提取路径 ,并提供多轮交互式分析洞察 。复杂查询准确率从58%跃升至86%,让数据查询与分析洞察告别“盲人摸象”,实现“精准靶向”。

智能诊断:高效响应下的质量检验

一直以来,传统汽车故障诊断需要经验丰富的资深人员依靠所掌握的知识和经验排查故障,但随着汽车保有量的提升,诊断需求的不断增多,使得原有业务模式难以持续。

基于此,团队创新性推出“推理大模型+时序大模型”的智能诊断方案,精准定位故障所在位置,使得故障处理速度提升10倍以上。对于一些复杂的、多因素导致的信号异常等质量问题,智能诊断通过时序大模型与深度学习时序检测算法融合的方案,融合后算法异常检出率高于92%。

同时探索构建时序基座大模型提升时序通用的预测能力,实现在小样本的情况下达到领先效果。此外,可无限复制扩展和自动迭代的 AI 模型在动态适配优化版本的同时,还能够有效降低诊断成本,以更安全、更高效的诊断交出属于小米汽车的质量答卷。

-

从生物进化的漫长征程到 AI 技术的跨越式发展,人类正站在一个前所未有的历史节点。小米始终相信,真正的技术突破源于对底层逻辑的深度理解,也源于对开放协作的坚定信念。从 Zipformer 到 Zapformer 的跨越,从泰坦合金的 AI 辅助研发到小米汽车全域质量多智能体引擎的落地应用,我们看到的不仅是技术本身的进化,更是 AI 如何穿透产业边界、重塑价值方式的生动实践。

未来,小米将继续深化 AI 技术在全生态的探索与应用,深入推进开源协作,不断为用户创造更加智能、便捷、富有想象力的生活方式,为AI技术的产业化落地与行业生态的繁荣发展贡献更多力量。

END

http://www.cnnetsun.cn/news/10520.html

相关文章:

  • Wan2.2-T2V-A14B支持自动字幕嵌入吗?多语种翻译生成测试
  • Wan2.2-T2V-A14B与Sora的技术路线差异比较
  • Java两种代理模式详解
  • MySQL基础篇——约束和事务
  • 【VSCode量子编程环境搭建指南】:手把手教你5步配置Qiskit开发环境
  • Flutter深度解析:从原理到实战的全栈开发指南
  • AI开眼了!多模态大模型架构全解析,从LLaVA到Qwen3-VL,小白也能秒懂的硬核指南
  • 4.10.1计算器含负数8086 ,基于8086的简易计算器可以显示负数,减法计算时可以得出负数显示,但是小于-9以后就显示E0溢出提示
  • Wan2.2-T2V-A14B能否生成适用于VR心理暴露疗法的创伤情境
  • 数据结构-栈(核心代码)
  • 哔哩下载姬:解锁B站视频离线收藏的终极方案
  • 关于电脑端抓包小程序的3种方法,黑客技术零基础入门到精通教程
  • AMD Nitro-E:轻量级文本到图像扩散模型家族的技术突破与性能解析
  • AI学习与职业发展:一次关于证书与能力的真实思考
  • 详细描述一条 SQL 在 MySQL 中的执行过程
  • 一文读懂GLM-Edge-4B-Chat:轻量化大模型如何重塑边缘智能应用新生态
  • Ubuntu22.04 5080配置深度学习环境
  • Wan2.2-T2V-A14B在虚拟演唱会背景制作中的大规模应用
  • Windows右键菜单清理与定制全攻略:ContextMenuManager高效使用指南
  • nginx实战-PHP——day2
  • 知识扩展--从病理学角度比较来自同一组织切片的Xenium 5K与Visium HD数据
  • 基于Wan2.2-T2V-A14B的AI导演系统原型设计思路
  • 【苍穹外卖-day12】
  • 金融项目的测试过程(额度申请审核的测试点设计)
  • C# AES加密在医疗系统中的真实应用案例(含完整源码与审计建议)
  • java计算机毕业设计球鞋商城系统小程序 基于SpringBoot的潮鞋微商城小程序设计与实现 JavaWeb限量球鞋交易平台小程序开发
  • Wan2.2-T2V-A14B能否生成黑白老电影风格?怀旧滤镜测试
  • 终极指南:原神自动化工具BetterGI完整使用手册
  • 在Linux中如何查看内存使用情况?
  • CompletableFuture的5大坑!