当前位置: 首页 > news >正文

CANN/asc-devkit SetFixSplit矩阵分块设置

SetFixSplit

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

功能说明

设置固定的baseM、baseN、baseK,单位为元素个数。

函数原型

int32_t SetFixSplit(int32_t baseMIn = -1, int32_t baseNIn = -1, int32_t baseKIn = -1)

参数说明

表1参数说明

参数名输入/输出描述
baseMIn输入设置固定的baseM,默认值为-1,表示不设置固定baseM,由tiling函数进行计算。
baseNIn输入设置固定的baseN,默认值为-1,表示不设置固定baseN,由tiling函数进行计算。
baseKIn输入当前仅支持取值为-1,暂不支持设置其它值。

返回值说明

-1表示设置失败;0表示设置成功。

约束说明

  • baseM*baseN个输出元素所占的存储空间大小不能超过L0C Buffer大小,即baseM * baseN * sizeof(C_TYPE) <= L0CSize。
  • baseM需要小于等于singleM按16个元素向上对齐后的值(如ceil(singleM/16)*16),baseN需要小于等于singleN以C0_size个元素向上对齐的值,其中singleM为单核内M轴长度,singleN为单核内N轴长度,half/bfloat16_t数据类型的C0_size为16,float数据类型的C0_size为8,int8_t数据类型的C0_size为32,int4b_t数据类型的C0_size为64。例如singleM=12,则baseM需要小于等于16,同时baseM需要满足分形对齐的要求,所以baseM只能取16;如果baseM取其他超过16的值,获取Tiling将失败。

调用示例

auto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()); matmul_tiling::MatmulApiTiling tiling(ascendcPlatform); tiling.SetFixSplit(16, 16, -1); // 设置固定的baseM、baseN

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.cnnetsun.cn/news/3167660.html

相关文章:

  • sra_tvm_adapter核心技术解析:softmax优化补丁的深度剖析
  • Selenium自动化实战:网页弹窗自动处理与元素定位技巧
  • Twine.js终极指南:5步掌握可视化互动叙事创作
  • 如何快速掌握zxcvbn:终极密码强度评估工具完全指南
  • 如何永久保存微信聊天记录:终极个人数据资产管理指南
  • 如何高效解决3大流媒体下载难题:N_m3u8DL-RE终极方案
  • 三步极速下载国家中小学智慧教育平台电子课本:免费PDF获取终极方案
  • Citra模拟器终极指南:如何快速解决3DS游戏黑屏闪退问题
  • 鸣潮自动化工具ok-ww:3分钟实现游戏全自动,解放双手的智能助手
  • CANN/docs ACLNN缓存限制
  • Herbie完整指南:如何快速获取15+种天气预报模型数据 [特殊字符]️
  • 如何完整备份微信聊天记录:WeChatMsg终极导出方案详解
  • Playnite游戏库管理神器:一站式整合Steam、Epic等20+平台游戏与模拟器
  • Cargo-script 入门指南:如何在 Rust 中像脚本一样运行代码
  • 如何永久保存你的数字记忆:WeChatMsg聊天记录完整备份终极指南
  • 告别Hackintosh噩梦:一个工具如何让普通PC秒变Mac
  • 终极指南:如何在3DS上原生运行GBA游戏的完整教程
  • 重新定义音频创作:Audacity开源音频编辑软件架构深度解析与专业应用实战
  • CorridorKey终极指南:5步掌握AI绿幕抠像的完整工作流
  • 3个步骤让你的旧款Mac焕发新生:OpenCore Legacy Patcher完全指南
  • 解锁B站视频离线收藏:Python驱动的4K超清下载方案
  • STM32与MC6470 IMU实现高精度姿态解算
  • 5分钟搭建专属AI音乐创作平台:Suno-API完全指南
  • 如何在消费级显卡上实现10分钟生成千帧视频?ComfyUI-WanVideoWrapper实战解析
  • 容器环境下的性能调优实战指南 - 解决Audiobookshelf资源占用问题
  • 2000-2025年Fama-French五因子模型数据+Stata代码
  • JX3Toy:告别重复操作,重新定义剑网3游戏体验
  • MAX9744 Class D放大器与MKV42F微控制器的音频系统设计
  • 3步解锁旧设备潜能:开源工具让老旧Mac焕发新生
  • DeepTutor深度研究模块完全指南:如何用AI助手系统化探索任何学术主题