当前位置: 首页 > news >正文

CANN/docs ACLNN缓存限制

ACLNN_CACHE_LIMIT

【免费下载链接】docs该仓库用于维护cann公共文档项目地址: https://gitcode.com/cann/docs

功能描述

此环境变量用于配置aclnn API在Host侧缓存的算子信息条目个数。缓存的算子信息包含workspace大小、算子计算的执行器、Tiling信息等。

单位:个,取值范围:[0,10000000],默认值为10000。当取值为0时,表示不开启算子信息缓存功能。

一般不建议设置ACLNN_CACHE_LIMIT环境变量,保持默认值即可。针对动态shape场景,若算子的shape范围较大,开发者可结合业务需求适当增加此环境变量取值,以增加算子缓存条目,从而提升调度性能。但需要注意,增加算子信息缓存条目会增加Host内存开销,具体请参见使用约束。

配置示例

export ACLNN_CACHE_LIMIT=10000

使用约束

  • 单算子的缓存按线程管理,线程之间使用不同的缓存,互不影响。ACLNN_CACHE_LIMIT配置的是每个线程的算子缓存条目个数。因此线程越多,算子缓存条目越多。

    每个算子缓存条目大约占2KB左右的Host内存,单算子cache的总内存占用大小为:ACLNN_CACHE_LIMIT * 线程数 * 2KB。

    以10个线程,ACLNN_CACHE_LIMIT=100000为例,这种情况下单算子cache的总内存占用为:10*100000*2KB=2GB。

  • 融合算子(大kernel算子)的缓存在进程级单独的内存池管理,单条cache占约20KB左右的Host内存,融合算子cache的总内存占用是:ACLNN_CACHE_LIMIT * 20KB。

  • 使用者应结合Host的内存总大小、线程数以及每一个算子缓存条目的大小合理地设置ACLNN_CACHE_LIMIT,设置过大可能导致Host内存占用过多,造成调度性能下降。

支持的型号

Atlas 推理系列产品

Atlas 训练系列产品

Atlas A2 训练系列产品/Atlas A2 推理系列产品

Atlas A3 训练系列产品/Atlas A3 推理系列产品

Ascend 950PR/Ascend 950DT

【免费下载链接】docs该仓库用于维护cann公共文档项目地址: https://gitcode.com/cann/docs

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.cnnetsun.cn/news/3167523.html

相关文章:

  • Herbie完整指南:如何快速获取15+种天气预报模型数据 [特殊字符]️
  • 如何完整备份微信聊天记录:WeChatMsg终极导出方案详解
  • Playnite游戏库管理神器:一站式整合Steam、Epic等20+平台游戏与模拟器
  • Cargo-script 入门指南:如何在 Rust 中像脚本一样运行代码
  • 如何永久保存你的数字记忆:WeChatMsg聊天记录完整备份终极指南
  • 告别Hackintosh噩梦:一个工具如何让普通PC秒变Mac
  • 终极指南:如何在3DS上原生运行GBA游戏的完整教程
  • 重新定义音频创作:Audacity开源音频编辑软件架构深度解析与专业应用实战
  • CorridorKey终极指南:5步掌握AI绿幕抠像的完整工作流
  • 3个步骤让你的旧款Mac焕发新生:OpenCore Legacy Patcher完全指南
  • 解锁B站视频离线收藏:Python驱动的4K超清下载方案
  • STM32与MC6470 IMU实现高精度姿态解算
  • 5分钟搭建专属AI音乐创作平台:Suno-API完全指南
  • 如何在消费级显卡上实现10分钟生成千帧视频?ComfyUI-WanVideoWrapper实战解析
  • 容器环境下的性能调优实战指南 - 解决Audiobookshelf资源占用问题
  • 2000-2025年Fama-French五因子模型数据+Stata代码
  • JX3Toy:告别重复操作,重新定义剑网3游戏体验
  • MAX9744 Class D放大器与MKV42F微控制器的音频系统设计
  • 3步解锁旧设备潜能:开源工具让老旧Mac焕发新生
  • DeepTutor深度研究模块完全指南:如何用AI助手系统化探索任何学术主题
  • 3个技巧:如何从海量GitHub项目中筛选出真正优质的中文开源资源
  • A2UI架构深度解析:下一代AI原生UI框架的技术演进与实现路径
  • ExplorerPatcher完整指南:3分钟让Windows界面重回高效工作模式
  • A2UI自定义组件开发:如何让AI界面拥有无限可能
  • CANN文档-IsNullptr函数
  • Varnish Dashboard日志分析:从海量数据中提取有价值信息的完整方法
  • 3分钟学会用Video2X:免费AI视频放大与帧率提升完整指南
  • 2026毕业生降AI率网站盘点:自研技术+安全合规哪家强?
  • PingFangSC字体包:解决跨平台字体显示问题的终极方案
  • Agent Skills技能依赖管理:如何处理跨技能的资源共享与冲突