当前位置: 首页 > news >正文

CANN/pyasc取小数计算函数

asc.language.adv.frac

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

asc.language.adv.frac(dst: LocalTensor, src: LocalTensor, count: int | None = None, temp_buffer: LocalTensor | None = None, is_reuse_source: bool = False) → None

按元素做取小数计算。

对应的Ascend C函数原型

template <typename T, bool isReuseSource = false> __aicore__ inline void frac(const LocalTensor<T>& dstTensor, const LocalTensor<T>& srcTensor, const LocalTensor<uint8_t>& sharedTmpBuffer, const uint32_t calCount)
template <typename T, bool isReuseSource = false> __aicore__ inline void frac(const LocalTensor<T>& dstTensor, const LocalTensor<T>& srcTensor, const LocalTensor<uint8_t>& sharedTmpBuffer)
template <typename T, bool isReuseSource = false> __aicore__ inline void frac(const LocalTensor<T>& dstTensor, const LocalTensor<T>& srcTensor, const uint32_t calCount)
template <typename T, bool isReuseSource = false> __aicore__ inline void frac(const LocalTensor<T>& dstTensor, const LocalTensor<T>& srcTensor)

参数说明

  • is_reuse_source:是否允许修改源操作数。
  • dst:目的操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。
  • src:源操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。源操作数的数据类型需要与目的操作数保持一致。
  • temp_buffer:临时缓存。
  • count:参与计算的元素个数。

约束说明

  • 不支持源操作数与目的操作数地址重叠。
  • 不支持temp_buffer与源操作数和目的操作数地址重叠。
  • 操作数地址对齐要求请参见 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址对齐约束”。

调用示例

pipe = asc.Tpipe() tmp_que = asc.TQue(asc.TPosition.VECCALC, 1) pipe.init_buffer(que=tmp_que, num=1, len=buffer_size) # buffer_size 通过Host侧tiling参数获取 shared_tmp_buffer = tmp_que.alloc_tensor(asc.uint8) # 输入tensor长度为1024,算子输入的数据类型为half,实际计算个数为512 asc.adv.frac(dst, src, count=512, temp_buffer=shared_tmp_buffer)

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/783508/

相关文章:

  • 为开源项目OpenClaw配置Taotoken以实现更灵活的Agent工作流
  • 合成数据验证特征缩放必要性的白盒实验方法
  • 基于YOLOv5与LSTM的智能交通信号控制系统实战
  • 东莞市全区域上门回收黄金 正规资质商家一站式服务 - 金掌柜黄金回收
  • SQL PIVOT原理与实战:从行转列到高性能宽表生成
  • 2026年山东沥青加温设备与道路养护设备源头厂家深度选购指南 - 企业名录优选推荐
  • 20251209樊沛东python程序设计实验三报告
  • CANN/cannbot-skills a2设备约束
  • CANN运行时任务更新指南
  • Llama 3.2 Vision轻量微调实战:500图打造电商级图文生成模型
  • CANN/HCOMM线程通知等待函数
  • CANN KV压缩Epilog算子
  • 活动大屏LED租赁哪个公司好 - 速递信息
  • 谷歌智能眼镜2026年将问世,Gemini驱动,多品牌合作亮点多!
  • CANN/cann-recipes-infer MoE路由分组量化算子
  • STRAIGHT_JOIN 用法
  • 区块链+AI+DAO构建反性勒索平台:技术架构与实战解析
  • 从clevercli看AI命令行工具的设计哲学与工程实践
  • 通过curl命令直接测试Taotoken多模型聚合接口的响应
  • 2026知名CRM系统测评:12款客户管理系统价值解析 - Blue_dou
  • CANN PTO Tile-Scalar汇编操作
  • LIME实战避坑指南:从医疗影像到金融风控的可解释性落地
  • Phi-2小模型深度解析:27亿参数如何实现强推理与高效部署
  • GEE实战:用MOD17A3HGF和MYD17A2H数据,手把手教你生成8天和月度NPP数据集(附完整代码)
  • 基于辩证唯物主义认识论的大语言模型架构设计与机理分析
  • AIGC检测是什么?论文查AI率和论文查重有什么不同?
  • ChatGPT推理能力深度测试:从假设演绎到因果推理的AGI试金石
  • CANN/pypto矩阵乘法API文档
  • 2026年德州沥青加温设备、沥青储存罐与筑路设备源头厂家选购指南 - 企业名录优选推荐
  • Python字典底层原理与工程实践全解