当前位置: 首页 > news >正文

CANN/asc-devkit asc_log向量对数函数

asc_log

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

按元素取自然对数,计算公式如下: $$ dst_i = ln({src_i}) $$

函数原型

  • 前n个数据计算

    __aicore__ inline void asc_log(__ubuf__ half* dst, __ubuf__ half* src, uint32_t count) __aicore__ inline void asc_log(__ubuf__ float* dst, __ubuf__ float* src, uint32_t count)
  • 高维切分计算

    __aicore__ inline void asc_log(__ubuf__ half* dst, __ubuf__ half* src, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint16_t src_repeat_stride) __aicore__ inline void asc_log(__ubuf__ float* dst, __ubuf__ float* src, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint16_t src_repeat_stride)
  • 同步计算

    __aicore__ inline void asc_log_sync(__ubuf__ half* dst, __ubuf__ half* src, uint32_t count) __aicore__ inline void asc_log_sync(__ubuf__ float* dst, __ubuf__ float* src, uint32_t count)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量)的起始地址。
src输入源操作数(矢量)的起始地址。
count输入参与计算的元素个数。
repeat输入迭代次数。
dst_block_stride输入目的操作数单次迭代内不同DataBlock间地址步长。
src_block_stride输入源操作数单次迭代内不同DataBlock间地址步长。
dst_repeat_stride输入目的操作数相邻迭代间相同DataBlock的地址步长。
src_repeat_stride输入源操作数相邻迭代间相同DataBlock的地址步长。

返回值说明

流水类型

PIPE_V

约束说明

  • 操作数地址重叠约束请参考通用地址重叠约束。
  • dst、src的起始地址需要32字节对齐。

调用示例

__ubuf__ half dst[256]; __ubuf__ half src[256]; asc_log(dst, src, 256);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1045025/

相关文章:

  • MC68340 SIM40模块:系统配置与硬件保护机制深度解析
  • 2026深圳油烟机清洗实测:吸力变小、噪音大、油污堵塞深度清洁+平台对比 - 一步到家
  • FluentTerminal全屏模式技术深度解析:沉浸式终端体验的架构实现
  • 学Simulink——燃料电池(PEMFC)热管理系统动态响应优化仿真
  • 3.gemini336相机在ubuntu22.04的ros2下运行
  • WiFi6协议深度解析-基于AX200与Ubuntu20.04的无线监控与故障诊断实战
  • 学硕停招,低分全刷!
  • 成本不到 5000 欧元!Matthias Plappert 公开在办公桌旁搭建机器人研究装置的研究过程
  • 三线制SPI驱动GC9306:从模拟到硬件DMA的性能跃迁
  • 探索Inkscape光学设计扩展:从创意到光路可视化的艺术之旅
  • GitHub Desktop终极汉化指南:5分钟实现界面完美本地化
  • 2026成都空调维修实测:不制冷、漏水、异响故障诊断+平台对比 - 一步到家
  • AI Agent 30天速成|Day4 教学笔记
  • 深入解析ColdFire调试模块:实时追踪与硬件断点实战指南
  • LangChain.js 2025终极实战指南:零代码构建企业级AI智能代理系统
  • MC68EC030嵌入式CPU:架构解析、缓存优化与总线设计实战
  • 什么ai可以生成word文档 AI导出鸭导出稳得一批
  • 2026年:网站谷歌排名好却在AI搜索不见?背后原因大揭秘
  • Insomnia环境变量管理终极指南:如何高效配置多环境API测试
  • 2026年阿里云 618 Hermes Agent/OpenClaw配置Token Plan搭建教程
  • 告别手动交易!Solana Jupiter Bot Config Wizard配置全攻略
  • HCS08外设模块深度解析:SCI、IIC、ATD实战配置与避坑指南
  • 【C++】模板初阶: 解析模板原理、实例化与特化
  • 2026年余姚小家电AI搜索GEO优化服务商评测对比 - 起跑123
  • 初识 Claude Code
  • 探索Fider:解锁开源反馈系统的3个架构秘密
  • 2026福州防水补漏维修团队实测盘点TOP4:福州业主房屋渗漏修缮靠谱选择 - 宅安选房屋修缮
  • Appium自动化测试全解析:从核心原理到实战应用
  • 探索War3编辑器(5):物体编辑器的核心概念与实战应用
  • GHelper终极指南:华硕笔记本轻量级控制中心,告别Armoury Crate臃肿时代