当前位置: 首页 > news >正文

种子扩散预览:兼具快速推理和高性能的下一代代码生成模型

概述

本研究提出了基于离散状态扩散(DSD)的快速推理模型–种子扩散预览(Seed Diffusion Preview),作为大规模语言建模的一种新方法。

传统的自回归(AR)模型是按顺序生成标记的,这限制了推理速度,即使是高精度推理也是如此。
另一方面,扩散模型可以并行生成,但由于其连续数据假设设计和顺序恢复过程,在自然语言处理领域存在速度和性能问题。

该方法将专门用于代码生成的学习流水线与两阶段课程学习、受限生成顺序学习、策略学习和分块并行推理等复杂改进相结合。

其结果是在 H20 GPU 上实现了每秒 2,146 个 token 的快速推理,同时在 HumanEval、LiveCodeBench 和 MBXP 等多个代码生成基准测试中保持了高性能。

这打破了速度与质量之间的权衡,证明了扩散语言模型的实际可行性。

建议的方法

种子扩散预览集成了以下要素,以克服自然语言处理的独特挑战,同时利用扩散模型的优势。

首先,它采用了 “两阶段课程学习(TSC)”,在初始阶段通过基于掩码的销毁过程建立稳健的基础,并在后期阶段增加基于编辑的销毁过程,以提高自我修正能力。

其次,"生成顺序约束学习 "利用 ELBO 最大化准则从大量候选生成顺序中提取高质量轨迹,并抑制顺序变化。

第三,"策略学习 "提高了速度,同时优化了推理过程中的步骤数量。此外,在推理过程中还采用了 "逐块并行生成 "技术,在保持块之间因果关系的同时高效生成标记。

除了这些设计,内部基础设施优化和 KV 缓存相结合,实现了速度和质量的双赢。

实验

该模型在代码生成领域的各种基准上进行了评估。

HumanEval和MBPP上的基本编码性能,BigCodeBench和LiveCodeBench上的实用和无时间污染竞争编程性能,以及MBXP上的多语言代码生成性能。
还使用 NaturalCodeBench 测试了基于自然用户查询的性能。

此外,还通过 Aider 和 CanItEdit 等代码编辑任务评估了修改现有代码的能力。

结果表明,Seed Diffusion Preview 在多项指标上的表现不亚于或优于其同等规模的前代产品(如 Mercury Coder 和 Gemini Diffusion),同时推理速度提高了 2 到 3 倍。

特别是在编辑任务方面,性能提升非常明显,证明了基于扩散的方法在代码生成和编辑方面的有效性。

http://www.cnnetsun.cn/news/101215.html

相关文章:

  • EmotiVoice是否支持方言合成?当前进展说明
  • EmotiVoice语音合成系统灰度总结报告撰写框架
  • EmotiVoice语音合成系统负载均衡部署方案探讨
  • 基于SSM框架的后台管理系统设计与实现
  • Python基础练习5.按顺序输出整数
  • 毕设救星:Spring Boot + Vue 打造“数字非遗”——中华传统文化展示与文创众筹平台
  • 政策模型出现再平衡:美联储主席遴选路径反转,哈塞特在“联储独立性约束条件”下明确立场
  • 医院信息科经常听到的那些话
  • 校园实验室|基于springboot 校园实验室管理系统(源码+数据库+文档)
  • AI的下一个十年,属于Agent!读懂这篇,你就抓住了未来十年的最大红利!
  • 基于springboot + vue律师咨询系统(源码+数据库+文档)
  • 基于springboot + vue动物园管理系统(源码+数据库+文档)
  • 锐捷网络设备(盒式交换机,路由器,EG网关,无线AC、AP)恢复出厂设置
  • 锐捷RG-AP220-E胖模式配置
  • 2026毕设ssm+vue基于框架的临时摊位管理系统论文+程序
  • 重磅推出!郑老师团队26年22门统计课程,发文即可退款
  • jQuery EasyUI 布局 - 创建折叠面板
  • jQuery EasyUI 布局 - 动态添加标签页(Tabs)
  • 基于 YOLOv8 + DeepSORT + PyQt5 构建的 多目标车辆测速系统 多目标跟踪和车辆测速 (1)
  • 告别手动计算:安全区域适配效率提升300%
  • 33、Ubuntu服务器故障排查指南
  • 从零开始:解决brew命令不存在的完整指南
  • 详解!30+基于YOLO开源框架视频AI算法,覆盖低空经济无人机巡检、海康/大华摄像头,城市综合治理、智慧工地、森林巡检
  • MySQL变长字段的庖丁解牛
  • EmotiVoice能否生成客服安抚语音?共情语调设计
  • xxx is not in the sudoers file. This incident will be reported问题解决
  • 电商网站Nginx部署实战:高并发场景优化方案
  • h5嵌入鸿蒙跳转支付宝支付,报错:Syntax error:JSON Parse error:Expected ‘}‘
  • 传统VS现代:Docker容器启动效率对比实验
  • Vue小白必看:5分钟搞懂Vue2和Vue3的区别