当前位置: 首页 > news >正文

CANN/asc-devkit InitStartBufHandle函数说明

InitStartBufHandle

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

Atlas 200I/500 A2 推理产品

Atlas 推理系列产品 AI Core

Atlas 推理系列产品 Vector Core

x

Atlas 训练系列产品

功能说明

设置TQue/TBuf的起始内存块指针、内存块的个数、每一块内存块的大小。

函数原型

__aicore__ inline void InitStartBufHandle(TBufHandle startBufhandle, uint8_t num, uint32_t len)

参数说明

表 1参数说明

参数名称

输入/输出

含义

startBufhandle

输入

TQue/TBuf的起始内存块指针,数据类型为TBufHandle(实际为uint8_t*)。

num

输入

分配内存块的个数。

len

输入

每一个内存块的大小,单位为Bytes。

约束说明

  • TQue、TBuf类继承自TQueBind类,所以TQue、TBuf对象也可使用该接口。

  • 该接口目前只提供给自定义TBufPool初始化TQue、TBuf的内存块时使用。

  • 当使用TBuf对象调用该接口时,入参num必须为1。

返回值说明

调用示例

完整示例请参考调用示例。

// 假设自定义tbufpool类为MyBufPool // 自定义tbufpool类内部对TQue初始化的InitBuffer函数: template<class T> __aicore__ inline bool MyBufPool::InitBuffer(T& que, uint8_t num, uint32_t len) { ... // 对TQue的内存块进行初始化 uint32_t curPoolAddr = 0; // 内存块起始地址 auto bufhandle = xxx; // 具体的内存块,该变量可由自定义tbufpool内获得 srcQue0.InitStartBufHandle(bufhandle, num, len); for (uint8_t i = 0; i < num; i++) { que.InitBufHandle(this, i, bufhandle , curPoolAddr + i * len, len); } ... } // 自定义tbufpool类内部对TBuf初始化的InitBuffer函数: template<class T> __aicore__ inline bool MyBufPool::InitBuffer(AscendC::TBuf<bufPos>& buf, uint32_t len) { ... // 对TBuf的内存块进行初始化 uint32_t curPoolAddr = 0; // 内存块起始地址 auto bufhandle = xxx; // 具体的内存块,该变量可由自定义tbufpool内获得 srcBuf1.InitStartBufHandle(bufhandle, 1, len); srcBuf1.InitBufHandle(this, 0, bufhandle , curPoolAddr, len); ... } AscendC::TPipe pipe; AscendC::TQue<AscendC::TPosition::VECIN, 1> srcQue0; AscendC::TBuf<AscendC::TPosition::VECIN> srcBuf1; MyBufPool tbufPool; pipe.InitBufPool(tbufPool, 1024 * 2); tbufPool.InitBuffer(srcQue0, 1, 1024); tbufPool.InitBuffer(srcBuf1, 1024);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.cnnetsun.cn/news/2464912.html

相关文章:

  • CANN/asc-devkit 设置梯度输出类型
  • HermesAgent工具连接Taotoken自定义模型提供方的完整流程
  • cann/asc-devkit SetGradOutput接口
  • ARM SPE Profiling Buffer机制与性能分析实践
  • 树莓派Web IDE:零配置云端编程环境与Python硬件模拟实践
  • Firebase JobDispatcher源码深度剖析:从调度到执行的完整链路
  • Linux存储核心:块设备与分区表的本质区别及实践指南
  • 量子门合成技术GULPS:异构硬件下的高效量子电路编译
  • Go语言事件驱动:CloudEvents
  • AmazingHand高级演示:手部追踪与逆运动学控制
  • Ormar 高级特性完全指南:字段加密、UUID 和约束条件详解
  • 54 深入解析poll多路复用技术
  • MySQL进阶
  • 【软考中级备考日记|系统集成项目管理工程师Day11:项目资源管理核心精讲\+团队建设冲突解决\+20道专项必刷题(带解析)】
  • 数据不会说谎:园区智能化带来的五个变化
  • PLINK实战:用--genome参数搞定GWAS数据中的“亲戚”排查(附pihat阈值选择心得)
  • 【Perplexity行业分析搜索终极指南】:2024年全球Top 5垂直领域实战数据+3大避坑红线
  • 临床决策倒计时:Perplexity医生信息搜索如何将循证检索从15分钟压缩至22秒?
  • 【原创】智询管理系统操作说明
  • 从伺服报警到产线停机:一个EtherCAT状态机跳变引发的故障诊断实录
  • GIS技巧100例23-ArcGIS像元统计实战:从月度栅格到年度气候指标
  • 从‘老王’到动态数据:C# Winform中Label控件如何优雅地绑定和更新显示内容
  • 实测 DeepSeek-V4 接入 Hermes:一句话爬取几十个网页,真的丝滑!
  • 技术动态 | 大模型驱动情报领域知识图谱构建新范式:ERC-KG方法精确率高达94.32% - 解放军网络空间部队信工大等
  • 基于双CNN架构的实时神经信号处理与FPGA实现
  • 5分钟快速合并B站缓存视频:m4s-converter终极使用指南
  • 半导体设备ETF(159516.SZ)单日大涨5.05%,规模超257亿领跑行业
  • IL‑4、IL-13:调控嗜酸性粒细胞与肥大细胞活化的关键细胞因子
  • Swift学习笔记29-数据库SQlite
  • CodeWave项目导出实战:从云端到本地的完整避坑指南(含数据库配置与端口冲突解决)