当前位置: 首页 > news >正文

.NET10 New feature 新增功能介绍-JIT编译器改进

首先.NET10是一个LTS版本,微软官方支持3年,所以作为最新的主力版本,可以尽快升级使用。

今天我们详细介绍一下.NET 10的一些新功能-JIT编译器改进

.NET 10 的 JIT 改进不是让慢代码变快,而是让“设计良好的代码不再被性能惩罚”。

对业务代码是否有“侵入性”?几乎没有

  • 不需要改写代码

  • 不需要 unsafe

  • 不需要特殊编译选项

你写的是“好代码”,JIT 会越来越聪明地帮你榨干性能。

.NET 10 中的 JIT 编译器包括通过更好的代码生成和优化策略提高性能的重要增强功能。改进结构参数的代码生成

.NET 的 JIT 编译器能够进行称为物理提升的优化,其中结构的成员放置在寄存器而不是堆栈中,从而消除了内存访问。 将结构传递给方法时,此优化特别有用,调用约定要求在寄存器中传递结构成员。

.NET 10 改进了 JIT 编译器的内部表示形式,以处理共享寄存器的值。 以前,当需要将结构成员打包到单个寄存器中时,JIT 将首先将值存储在内存中,然后将其加载到寄存器中。 现在,JIT 编译器可以将结构参数的优化成员直接存储到共享寄存器中,从而消除不必要的内存操作。

struct Point { public long X; public long Y; public Point(long x, long y) { X = x; Y = y; } } [MethodImpl(MethodImplOptions.NoInlining)] private static void Consume(Point p) { Console.WriteLine(p.X + p.Y); } private static void Main() { Point p = new Point(10, 20); Consume(p); }

在 x64 CPU架构上,/* by 01130.hk - online tools website : 01130.hk/zh/formatxml.html */ Point的成员会分配到单独的寄存器,并传递给/* by 01130.hk - online tools website : 01130.hk/zh/formatxml.html */ Consume。由于本地p的物理提升已启动,因此最初不会在堆栈上分配任何内容。

Program:Main() (FullOpts):
mov edi, 10
mov esi, 20
tail.jmp [Program:Consume(Program+Point)]

现在,假设成员Point的类型已更改为int而不是long。 由于 aint为四个字节宽,寄存器在 x64 上宽 8 个字节,因此调用约定要求在一个寄存器中传递成员Point

以前,JIT 编译器首先将值存储到内存中,然后将八字节区块加载到寄存器中。

在.NET 10中,JIT 编译器现在可以直接将结构参数的提升成员放入共享寄存器中:

Program:Main() (FullOpts):
mov rdi, 0x140000000A
tail.jmp [Program:Consume(Program+Point)]

这样就不需要中间内存存储,从而生成更高效的程序集代码。

改进了循环转化

JIT 编译器可以提升循环的条件while,并将循环体转换为do-while循环,从而生成最终形状:

if (loopCondition) { do { // loop body } while (loopCondition); }

此转换称为循环反转。 通过将条件移动到循环底部,JIT 无需将分支到循环顶部来测试条件,从而改进代码布局。 许多优化(如循环克隆、循环展开和感应变量优化)也依赖于循环反转来生成此形状来帮助分析。

.NET 10 通过从词法分析实现切换到基于图形的循环识别实现来增强循环反转。

此更改会考虑所有自然循环(即只有单个入口点的循环)并忽略以前被考虑的误报,从而提高了精度。 这使得包含forwhile语句的 .NET 程序具有了更高的优化潜力。

数组接口方法反虚拟化

.NET 10 的重点 领域 之一是减少常用语言功能的抽象开销。 为了追求此目标,JIT 去虚拟化方法调用的能力已经扩展为涵盖数组接口方法。

请考虑遍历一个数组的典型方法:

static int Sum(int[] array) { int sum = 0; for (int i = 0; i < array.Length; i++) { sum += array[i]; } return sum; }

此代码形式易于 JIT 优化,主要是因为不存在虚拟调用。 相反,JIT 可以专注于删除对数组访问的边界检查,并应用 .NET 9 中添加的循环优化。 以下示例添加一些虚拟调用:

static int Sum(int[] array) { int sum = 0; IEnumerable<int> temp = array; foreach (var num in temp) { sum += num; } return sum; }

基础集合的类型是明确的,JIT 应该能够将此代码片段转换为第一个代码片段。 但是,数组接口的实现方式与“普通”接口不同,因此 JIT 不知道如何对它们进行反虚拟化。 这意味着循环中的foreach枚举器调用仍然是虚拟的,从而阻止了多个优化,例如内联和堆栈分配。

从 .NET 10 开始,JIT 可以取消虚拟化和内联数组接口方法。 这是实现两者性能相等的诸多步骤中的第一步,如.NET 10 去抽象计划中所述。

内联改进

.NET 10 中进行了各种内联改进。

JIT 现在可以内联因以前的内联而适合实现非虚拟化的方法。 这种改进使 JIT 可以发现更多的优化机会,例如进一步内联和去虚拟化。

某些具有异常处理语义的方法(尤其是具有try-finally块的方法)也可以内联。

为了更好地利用 JIT 的堆栈分配某些数组的能力,内联器的启发式算法已进行调整,以提高可能返回小型固定大小数组的候选项的收益。

返回类型

在内联过程中,JIT 编译器现在会更新临时变量的类型,这些变量用于存储返回值。 如果被调用方中的所有返回站点都生成相同的类型,则使用此精确的类型信息来取消后续调用的虚拟化。 此增强功能补充了后期非虚拟化和数组枚举去抽象的改进。

配置文件数据

.NET 10 改进了 JIT 的内联策略,以更好地利用配置文件数据。 在众多启发式算法中,JIT 内联器不会对超过一定大小的方法进行内联,以避免使调用方法变得臃肿。 当调用方拥有表明某个内联候选函数被频繁执行的配置文件数据时,内联器会增加对该候选函数的大小容忍度。

假设 JIT 将没有配置文件数据的被调用方Callee内联到具有配置文件数据的调用方Caller中。 这种不一致可能发生在被调用方过小而不值得进行检测,或者被调用方被内联调用过于频繁,从而导致调用次数不足。 如果Callee拥有自己的内联候选项,JIT 此前并未将其纳入考虑范围,因为Callee缺乏性能分析数据。 现在,JIT 将识别到Caller拥有配置文件数据,并因此放宽其大小限制(但为了弥补精度损失,这种放宽程度不及Callee拥有配置文件数据时)。

同样,当 JIT 决定某个调用点不适合进行内联优化时,它会用NoInlining标记该方法,以避免未来再次尝试对该方法进行内联优化。 但是,许多内联启发法对配置文件数据很敏感。 例如,在缺少配置文件数据的情况下,JIT 可能会认为某个方法太大而不值得进行内联。 但是,当调用方足够热时,JIT 可能愿意放宽其大小限制并内联调用。 在 .NET 10 中,JIT 不再用NoInlining标记那些无利可图的内联函数,以避免配置文件数据导致调用点的性能恶化。

堆栈分配

堆栈分配可减少 GC 必须跟踪的对象数,并且还会解锁其他优化。 例如,在对象被堆栈分配后,JIT 可以考虑将其完全替换为其标量值。 因此,堆栈分配是减少引用类型的抽象惩罚的关键。 .NET 10 为值类型和引用类型的小型数组添加堆栈分配。 它还包括对本地结构字段和委托的转义分析。 (无法转义的对象可以在堆栈上分配。)

周国庆

2025/12/21

http://www.cnnetsun.cn/news/172690.html

相关文章:

  • Open-AutoGLM迁移学习应用瓶颈突破(专家级调优策略全公开)
  • 【Open-AutoGLM局域网部署终极指南】:手把手教你从零搭建高效私有化AI推理环境
  • 健身达人微信小程序的设计与实现毕设源码(源码+lw+部署文档+讲解等)
  • Open-AutoGLM如何实现无缝跨平台部署?:99%工程师忽略的5个关键适配步骤
  • 利用docker在windows 11 wsl中安装oracle 12cR2
  • 【Open-AutoGLM预训练模型适配指南】:揭秘高效迁移学习背后的核心技术细节
  • Cesium快速入门30:CMZL动画
  • Excalidraw工业互联网平台架构图实战
  • 重器轻用后,你的笔记资料分散各处,怎么办?
  • 10 个AI论文工具,助继续教育学员轻松完成写作!
  • 显存暴涨问题难追踪?Open-AutoGLM动态资源监控方案来了
  • Open-AutoGLM生产环境崩溃频发,这套自动修复配置让你彻底告别半夜救火
  • Excalidraw在自动驾驶软件模块设计中的实践
  • 基于大数据的热门音乐歌曲采集分析系统爬虫 可视化
  • Excalidraw大数据平台ETL流程可视化
  • 5个策略帮助企业成功实施YashanDB
  • 揭秘YUV:为何人眼被“欺骗”却浑然不觉
  • Excalidraw自由画笔工具的手绘感调节参数
  • 信安毕业设计创新的项目选题推荐
  • Excalidraw企业定制化开发接口(API)文档概览
  • Python中append和extend区别在哪?如何选择才不出错
  • Thinkphp和Laravel框架+vue的桂林广西旅游服务网站系统功能多_1e9t9f02-vue
  • 【高阶技术内参】:Open-AutoGLM在社交舆情监控中的4大隐秘应用场景
  • Open-AutoGLM测试自动化落地全记录(20年专家亲测方案)
  • 好写作AI:当AI成为“作者”,谁来为学术诚信把关?
  • 计算机毕业设计springboot基于BS的迎新管理和服务系统 高校新生报到一体化服务平台的设计与实现 SpringBoot+Vue 架构下的智慧迎新信息系统
  • 揭秘Open-AutoGLM基准测试工具:如何在3步内完成高精度性能评估并优化大模型响应速度
  • 【Open-AutoGLM性能基准测试全解析】:掌握AI模型评测核心技术,提升推理效率的5大关键指标
  • Cortex - A系列SoC工程代码那些事儿
  • 揭秘Open-AutoGLM集成难题:如何在7天内完成自动化适配?