当前位置: 首页 > news >正文

CANN/ops-nn Elu算子实现

Elu

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品
Atlas 推理系列产品
Atlas 训练系列产品

功能说明

  • 接口功能: 对输入张量self中的每个元素x调用指数线性单元激活函数ELU,并将得到的结果存入输出张量out中。

  • 计算公式:

    $$ ELU(x) = \begin{cases} scale \ast x, \quad x > 0\ \alpha \ast scale \ast (exp(x \ast inputScale)-1), \quad x \leq 0 \end{cases} $$

  • 参数说明:

    参数名输入/输出描述使用说明数据类型数据格式维度(shape)非连续Tensor
    self输入表示ELU激活函数的输入,公式中的x。支持空Tensor。FLOAT、FLOAT16、BFLOAT16ND0-8
    alpha输入表示ELU激活函数的激活系数,公式中的α。数据类型需要是可转换为FLOAT的数据类型。----
    scale输入表示ELU激活函数的缩放系数,公式中的scale。数据类型需要是可转换为FLOAT的数据类型。----
    inputScale输入表示ELU激活函数的输入的缩放系数,公式中的inputScale。数据类型需要是可转换为FLOAT的数据类型。----
    out输出表示ELU激活函数的输出。shape需要与self一致。FLOAT、FLOAT16、BFLOAT16ND0-8
    - Atlas 训练系列产品 :数据类型支持FLOAT、FLOAT16。

约束说明

调用说明

调用方式调用样例说明
aclnn调用test_aclnn_elu通过aclnnElu&aclnnInplaceElu接口方式调用Elu算子。
aclnn调用test_aclnn_inplace_elu通过aclnnElu&aclnnInplaceElu接口方式调用Elu算子。

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/786802/

相关文章:

  • k8s-tew:专为边缘与离线场景设计的轻量Kubernetes发行版实战指南
  • 逆向工程一个小游戏:学习其架构与设计思路
  • CANN/ops-transformer FlashAttention可变长评分
  • MCP 技术深度解析及其在 AI Agent 中的应用
  • 利用Taotoken模型广场为不同应用场景快速筛选合适的大模型
  • ARM CoreSight拓扑检测技术原理与应用详解
  • 收藏!AI时代小白程序员必看:10个方向、3条路径、1个被搞反的公式助你职业起飞!
  • ARM7TDMI-S内存接口与调试技术详解
  • x402协议:AI智能体机器经济基础设施与微支付实践
  • 数字示波器频率响应与上升时间测量技术解析
  • 2026年AI调用量千倍增长、价格跌超80%,算力为何反而稀缺且更贵?
  • Cursor规则文件转智能体配置:自动化同步项目规范与AI助手
  • AI赋能量子化学:从密度泛函理论到机器学习加速与泛函设计
  • 如何高效去除图片水印:基于深度图像先验的完整指南
  • 基于Next.js 14与Vercel AI SDK构建企业级全栈AI聊天应用
  • 收藏!小白程序员必看:如何利用AI三层架构实现大模型落地价值?
  • 【OpenClaw从入门到精通】第75篇:大厂龙虾三巨头——腾讯WorkBuddy、华为小艺Claw、小米miclaw对比选型(2026横评版)
  • CANN权重量化分组矩阵乘
  • 深入理解 MCP (Model Context Protocol):大模型时代的标准化接口协议
  • 还在为加密视频无法下载而烦恼?试试这款跨平台流媒体下载神器!
  • 星识科技获数千万元融资,Vizta智能望远镜破局长焦观测赛道!
  • [RPA实战教程] 拼多多/TEMU店群自动化 (运维篇):构建RPA集群控制塔与OTA热更新架构
  • 基于微信iPad协议实现自动化机器人:openclaw-wechat部署与开发实战
  • Deep Agent全解析:为什么普通Agent只能“浅尝辄止”,而Deep Agent能真正干复杂活?
  • OpenFang开源AI智能体框架:从核心原理到实战部署全解析
  • Cortex-M0微控制器架构解析与低功耗设计实践
  • Flutter与Firebase构建钓鱼智能日志应用:从数据采集到分析
  • ContentPipe:构建可控AI图文生产流水线,实现人机协同内容创作
  • 工业神经系统:10 网络安全+未来TSN+6G:工厂的“数据护城河
  • ARMv8/9 AArch64系统指令:缓存与地址转换详解