当前位置：首页 > news >正文

哪些因素和参数会影响Bloom的性能开销

news 2026/6/14 9:59:43

1）哪些因素和参数会影响Bloom的性能开销
2）为何Scripting Threads的#0线程数量异常

这是第457篇UWA技术知识分享的推送，精选了UWA社区的热门话题，涵盖了UWA问答、社区帖子等技术知识点，助力大家更全面地掌握和学习。

From UWA AI 问答

Q：哪些因素和参数会影响bloom的性能开销？

A：Bloom（泛光）的性能开销主要来自GPU带宽、计算量与多级采样次数，其关键影响因素和可调参数如下：
一、核心性能影响因素
采样分辨率与下采样层级
Bloom默认从1/2渲染分辨率开始逐级下采样（如Blur1–Blur5），分辨率越低（如1/16）、层级越多，带宽越低但模糊质量下降；反之，高分辨率采样（如1/2）显著增加纹理读取带宽和显存吞吐压力。
移动端建议从1/4或1/8起始，减少首层采样开销。
BloomQuality级别
r.BloomQuality=5（默认）启用全部5层模糊+高质量卷积，开销最大；=1~3可禁用部分层级或使用简化高斯，大幅降低GPU耗时。
ScreenPercentage控制卷积精度
r.Bloom.ScreenPercentage=50表示FFT卷积在50%分辨率下执行；提高该值（如至100%）会线性增加计算与带宽，需谨慎权衡。
泛光卷积（Convolution）启用
启用Bloom Convolution会触发FFT卷积运算，依赖全分辨率内核纹理+额外缓冲区（r.Bloom.ConvolutionBuffer），显著提升GPU计算与显存带宽压力，仅推荐高端设备或离线渲染使用。
后处理链路叠加效应
Bloom常与Tonemapping、Depth of Field、Motion Blur等串联，导致多次全屏纹理读写。尤其在移动平台，多Pass后处理易引发带宽瓶颈（实测可达总GPU带宽的20%+）。
二、关键可调控制台变量（Unreal Engine）
三、优化建议
优先降级BloomQuality+ScreenPercentage，比关闭Bloom更能平衡画质与性能；
使用Stat GPU和Stat RHI定量定位Bloom耗时（查看PostProcessBloom阶段）；
避免在低端机启用Convolution或Dirt Mask（额外纹理采样+混合）；
结合r.VSync与帧率限制，防止Bloom在高帧率下反复重采样。
注：Bloom对GPU温度与功耗影响显著 —— 实测10GB/s带宽可贡献约1000mW功耗（占整机20%+），是移动端发热主因之一。

分享链接：
https://www.uwa4d.com/main/uwa-shared.html?shareId=f3f99f69-7e55-4af8-9a58-2531d33ec39a

From UWA AI 问答

Q：请教个问题, 我们有用到线程池, 我在Profiler的时候看到在Scripting Threads里面有几十个#0的线程显示, 这个是正常的吗？

A：是不正常的，需立即排查。

Unity的Profiler中出现大量名称为#0的Scripting Threads，通常表明：
线程未正确命名或未注册：Unity默认对System.Threading.ThreadPool中的线程不自动命名，Profiler无法识别其用途，统一显示为#0（或空名+编号）。

线程泄漏风险高：若线程池长期持有大量闲置线程（尤其在Unity 2019 – 2022版本中），可能因ThreadPool.SetMinThreads调用不当、异步任务未完成/未释放、或Task.Run+长阻塞操作导致线程堆积。

非Unity管理线程被误纳入Profiler视图：#0线程无法通过Profiler.BeginThreadProfiling()注册，说明它们未被主动追踪，也意味着你无法在Timeline中定位其耗时来源。

建议动作：
检查是否滥用Task.Run或ThreadPool.QueueUserWorkItem；优先改用Unity Job System或Unity.Collections.LowLevel.Unsafe异步方案。
确认无new Thread(...).Start()后未调用Profiler.EndThreadProfiling()（否则资源泄漏且线程残留）。
在Editor中启用Call Stacks+Deep Profiling，筛选GC Alloc/CPU高耗时帧，定位创建线程的调用栈。
使用UWA GOT Online的Mono/Threading模块，查看线程数趋势与存活时间，确认是否随游戏时长持续增长。
注：Unity官方不鼓励直接使用.NET线程池进行高频短任务调度 —— Job System才是跨平台、可Profiler可视化的首选。