当前位置: 首页 > news >正文

Ascend C数据解压搬运API

LoadDataUnzip

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

x

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

x

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

x

Atlas 200I/500 A2 推理产品

x

Atlas 推理系列产品 AI Core

Atlas 推理系列产品 Vector Core

x

Atlas 训练系列产品

x

功能说明

将GM上的数据解压并搬运到A1/B1/B2上。执行该API前需要执行LoadUnzipIndex加载压缩索引表。

函数原型

template <typename T> __aicore__ inline void LoadDataUnzip(const LocalTensor<T>& dst, const GlobalTensor<T>& src)

参数说明

表 1参数说明

参数名称

输入/输出

含义

dst

输出

目的操作数,类型为LocalTensor,支持的TPosition为A1/B1/B2。

LocalTensor的起始地址需要保证:TPosition为A1/B1时,32字节对齐;TPosition为B2时,512B对齐。

支持的数据类型为:int8_t。

src

输入

源操作数,类型为GlobalTensor。数据类型需要与dst保持一致。

约束说明

  • 操作数地址对齐要求请参见通用地址对齐约束。

返回值说明

调用示例

该调用示例支持的运行平台为Atlas 推理系列产品AI Core。

uint32_t srcLen = 896, dstLen = 1024, numOfIndexTabEntry = 1; AscendC::LocalTensor<int8_t> weightB1 = inQueueB1.AllocTensor<int8_t>(); AscendC::LoadUnzipIndex(indexGlobal, numOfIndexTabEntry); // 加载索引数据,加载GM上的压缩索引表到内部寄存器 AscendC::LoadDataUnzip(weightB1, weGlobal); // 根据内部寄存器里的索引表加载数据

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/851330/

相关文章:

  • 5步掌握APK-Installer:Windows上最轻量安卓应用安装方案
  • LeetCode 课程表III题解
  • 猫抓视频嗅探扩展:如何快速下载网页视频的完整终极指南
  • 2026 工地路基箱、铺路钢板口碑优选榜单:重庆地区施工垫板、移动洗车槽靠谱厂家综合推荐,适配工地临时铺路、渣土车辆冲洗、场地硬化支护,实用耐用性价比高 - 海棠依旧大
  • Pixelle-Video:如何让AI为您的声音创作注入灵魂?
  • Gemini赋能安全工程师:自动写PoC脚本
  • 如何3分钟搞定专业级虚拟背景:obs-backgroundremoval快速上手指南
  • 2026 年东莞家装设计与整装公司选型指南及性价比对比分析 - 品牌企业推荐师(官方)
  • 3步搞定B站硬核会员!AI自动答题工具bili-hardcore让你轻松过关
  • 雨和虹防水维修:德州德百玫瑰园阳台漏水维修真实案例|季风气候渗水根治+业主实拍好评 - 雨和虹防水维修
  • 5分钟快速上手Vue3思维导图:打造专业级数据可视化应用
  • Cursor Free VIP:终极免费解锁Cursor Pro高级功能的完整指南
  • 2026最新英语作文批改神器 学生党备考提分的实用辅助工具
  • 思源宋体TTF格式终极指南:免费商用中文字体的完整使用教程
  • Avogadro 2:如何免费实现专业级3D分子建模与可视化?
  • 如何在Windows系统上轻松安装安卓应用:APK安装器完整指南
  • 3天掌握Dify工作流开发:从零构建企业级AI应用的完整指南
  • 5分钟彻底净化Windows 11:Win11Debloat终极优化指南
  • Altium Designer实战:电子钟PCB布局布线避坑指南(附完整工程文件)
  • 构建专属数字人交互平台:从零到一的轻量化实现方案
  • LangChain4j-examples:基于Java的AI智能体工作流编排深度解析与实践指南
  • 告别DDPG训练不稳定!用SAC(软性演员-评论家)算法搞定复杂环境强化学习
  • 别再让超长图例毁了你的ECharts饼图!手把手教你配置legend换行与滚动分页
  • 如何轻松解锁Steam Deck完整潜力:Decky Loader插件加载器实战指南
  • 3步实现微信防撤回终极解决方案:消息保留工具完全指南
  • 广东省报考cppm指定授权机构-报名scmp证书优秀推广单位 - 品牌企业推荐师(官方)
  • IndexTTS-vLLM技术突破:重新定义语音合成性能边界
  • 昇腾C FMA临时缓冲区因子大小接口
  • 别再为VMware里Kali上不了网发愁了!三种网络模式(桥接/NAT/仅主机)保姆级配置与排错指南
  • 2026年数据治理工具推荐:瓴羊Dataphin、龙石、火山引擎横评对比 - 博客万