当前位置: 首页 > news >正文

CANN ops-nn GeGluV2算子

GeGluV2

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品×
Atlas 推理系列产品
Atlas 训练系列产品×
Kirin X90 处理器系列产品
Kirin 9030 处理器系列产品

功能说明

  • 接口功能:高斯误差线性单元激活门函数,针对aclnnGeGlu,扩充了设置激活函数操作数据块方向的功能。

  • 计算公式: 若activateLeft为true,表示对$self$的左半部分做activate

    $$ out_{i}=GeGlu(self_{i}) = Gelu(A) \cdot B $$

    若activateLeft为false,表示对$self$的右半部分做activate

    $$ out_{i}=GeGlu(self_{i}) = A \cdot Gelu(B) $$

    其中,$A$表示$self$的左半部分,$B$表示$self$的右半部分。

参数说明

参数名输入/输出/属性描述数据类型数据格式
self输入公式中的输入self。FLOAT、FLOAT16、BFLOAT16ND
dim可选属性设定的slice轴,需要对self对应的轴进行对半切,同时dim对应的self的轴必须是双数。INT64ND
approximate可选属性GeGlu计算使用的激活函数索引,0表示使用“none”,1表示使用“tanh”。INT64-
activateLeft属性表示激活函数操作数据块的方向,false表示对右边做activate,true表示对左边做activate。BOOL-
out输出公式中的dx。FLOAT、FLOAT16、BFLOAT16ND
outGelu输出公式中的outGelu。FLOAT、FLOAT16、BFLOAT16ND
  • GeGlu不包含activateLeft参数。
  • Atlas 推理系列产品 、 Atlas 训练系列产品 :self、out和outGelu的数据类型支持FLOAT、FLOAT16。
  • Kirin X90/Kirin 9030处理器系列产品:self、out和outGelu的数据类型不支持BFLOAT16。

约束说明

调用说明

调用方式调用样例说明
aclnn调用test_aclnn_ge_glu通过aclnnGeGlu接口方式调用GeGluV2算子。
aclnn调用test_aclnn_ge_glu_v3通过aclnnGeGluV3接口方式调用GeGluV2算子。
图模式调用-通过算子IR构图方式调用GeGluV2算子。

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/786531/

相关文章:

  • 衍射层析成像技术:原理、优化与医学应用
  • AI编程助手如何对抗能力错觉?agentic-learning技能包实战指南
  • 告别课堂赴一线,探秘企业知发展 —— 文理基础学院开展名企走访职业启蒙教育
  • Cursor云端智能体HTTP客户端实战:soenneker库配置与优化指南
  • 2026 最新 AI 漫剧工具,支持长剧情生成
  • 多模态大模型技术架构与工业应用解析
  • Git 知识点深度解析:从底层原理到实战避坑,十年架构师经验分享
  • Rewardful vs PartnerShare:2026 联盟营销管理追踪软件对比指南
  • AI工具高效选型指南:从Awesome List到四维评估框架
  • 最新全流程GMS地下水数值模拟及溶质(包含反应性溶质)运移模拟技术深度应用
  • 仓库管理还在“凭感觉”?搞懂WMS这5个核心能力,库存混乱一扫空
  • 如何快速掌握文档下载技巧:kill-doc工具的完整终极指南
  • AITop开源AI工具箱:多模型管理、提示词工程与RAG部署实战
  • 录音实时转文字软件推荐:从素材积压到文案成稿的 2026 年完整方案
  • 基于classmcp构建AI本地工具:Python类封装与MCP协议实践
  • 游戏策划:用玩家测试数据验证设计贡献
  • 畅联云平台丨教育AIoT数据底座:构建“人—课—场—能”四维融合的视频与IoT统一中枢
  • 代码随想录打卡 第二十一天
  • RWKV Runner:一站式桌面应用,轻松部署与集成开源大语言模型
  • 企业官网搭建的坑,我替你踩过了:别等网站打不开才后悔
  • 智慧树自动学习神器:如何用Autovisor轻松解放你的双手
  • AI代码审计工具Vulnhuntr实战:LLM如何挖掘复杂逻辑漏洞
  • vcs后仿(+sdf)踩坑记录 外围协议接口 双端握手异步
  • three粒子飘动效果
  • CANN/cannbot-skills:KVCache Offload 异步搬运流案例
  • 电源管理设计:能效优化与同步整流技术实践
  • 使用 Taotoken 聚合多模型 API 为创业项目构建智能客服原型
  • 解锁以太坊交易效率:PBS 与棘刺雕猴的深度实践
  • 深度定制Linux内核:为特定硬件优化CPU调度与电源管理
  • IncreRTL框架:基于LLM的精准增量RTL代码生成技术