当前位置: 首页 > news >正文

CANN/ops-nn GELU量化算子

GeluQuant

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品×
Atlas 推理系列产品×
Atlas 训练系列产品×
Kirin X90 处理器系列产品
Kirin 9030 处理器系列产品

功能说明

  • 接口功能:将GeluV2与DynamicQuant/AscendQuantV2进行融合,对输入的数据self进行GELU激活后,对激活的结果进行量化,输出量化后的结果。

  • 计算公式:

  1. 先计算GELU计算得到geluOut

    • approximate = tanh

    $$ geluOut=Gelu(self)=self × Φ(self)=0.5 * self * (1 + Tanh( \sqrt{2 / \pi} * (self + 0.044715 * self^{3}))) $$

    • approximate = none

    $$ geluOut=Gelu(self)=self × Φ(self)=0.5 * self *[1 + erf(self/\sqrt{2})] $$

  2. 再对geluOut进行量化操作

  • quant_mode = static

$$ y = round_to_dst_type(geluOut * inputScaleOptional + inputOffsetOptional, round_mode) $$

  • quant_mode = dynamic

    $$ geluOut = geluOut * inputScaleOptional $$ $$ Max = max(abs(geluOut)) $$ $$ outScaleOptional = Max/maxValue $$ $$ y = round_to_dst_type(geluOut / outScaleOptional, round_mode) $$

  • maxValue: 对应数据类型的最大值。

    DataTypemaxValue
    INT8127
    FLOAT8_E4M3FN448
    FLOAT8_E5M257344
    HIFLOAT832768

参数说明

参数名输入/输出/属性描述数据类型数据格式
self输入公式中的输入self。BFLOAT16、FLOAT16、FLOATND
inputScaleOptional输入公式中的输入inputScaleOptional。BFLOAT16、FLOAT16、FLOATND
inputOffsetOptional输入公式中的输入inputOffsetOptional。BFLOAT16、FLOAT16、FLOATND
approximate属性
  • GELU激活函数的模式。
  • approximate仅支持{"none", "tanh"}。
STRING-
quantMode属性
  • 量化的模式。
  • quantMode仅支持{"static", "dynamic"}。
STRING-
roundMode属性
  • 数据转换的模式。
  • 支持{"rint", "round", "hybrid"}模式。
STRING-
dstType属性
  • 数据转换后y的类型。
  • 输入范围为{2, 34, 35, 36}。
INT64_T-
y输出公式中的输出y。FLOAT8_E4M3FN、FLOAT8_E5M2、HIFLOAT8、INT8ND
outScaleOptional输出公式中的outScaleOptional。FLOATND
  • Kirin X90/Kirin 9030处理器系列产品:self、inputScaleOptional和inputOffsetOptional的数据类型不支持BFLOAT16。y不支持FLOAT8_E4M3FN、FLOAT8_E5M2、HIFLOAT8。

约束说明

inputScaleOptional的数据类型与self的类型一致,或者在类型不一致时采用精度更高的类型。

调用说明

调用方式调用样例说明
aclnn调用test_aclnn_gelu_quant通过aclnnGeluQuant接口方式调用GeluQuant算子。
图模式调用test_geir_gelu_quant通过算子IR构图方式调用GeluQuant算子。

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/784229/

相关文章:

  • 购物卡回收推荐:2026年靠谱卡券回收平台全面测评与选择指南 - 资讯焦点
  • 高质量色织布采购指南:工艺深度与品控标准解析 - 资讯焦点
  • 部署高性能嵌入模型服务:从BGE-M3到生产级RAG应用实战
  • 2050年欧非AI发展差距与人口结构对劳动力市场的重塑
  • 基于Transformer的序列标注实战:从NER到魔法咒语识别
  • 西安不干胶标签定制哪家好?松林森彩印vs传统印刷厂深度对比 - 企业名录优选推荐
  • 杭州除甲醛公司怎么选?聚焦杭州除甲醛主流技术大比拼:原理、效果、持久性! - 速递信息
  • 医疗生成式AI伦理挑战与TREGAI评估清单:从原则到实践
  • 山东联华土工材料有限公司:2026年经编涤纶/单向双向塑料/钢塑复合土工格栅厂家推荐,土工材料全系供应 - 品牌推荐官
  • 科学AI安全挑战:从化学合成到毒性预测的风险与防护
  • 2026年5月蚌埠防水公司排行榜TOP1:同城上门防水补漏13956389680 - 新闻快传
  • 去痘印泥膜推荐 14天搞定痘印,皮肤干净到发光 - 全网最美
  • 2026年西安画册印刷厂排名:高新技术企业如何保障交期与品质 - 企业名录优选推荐
  • CANN/ge:历史原型库设计文档(ES 场景)
  • ChatGPT教育应用:用户感知、挑战与AI学习能力构建实践
  • Python自动化内容抓取工具snapclaw实战:从配置到反爬策略
  • IP6520_Q1 36W输出 集成多种快充输出协议的降压SOC 支持 PD2.0/PD3.1/PPS ,QC2.0/QC3.0/QC3+,AFC,FCP
  • 梯度下降算法:机器学习优化的核心原理与实践
  • AI算力治理:从技术原理到产业实践,如何管控AI时代的核心资源
  • 2026年昆明曲靖代理记账与工商变更全生命周期企业财税合规深度横评指南 - 年度推荐企业名录
  • 足球场照明选型指南:专业系统如何解决夜间赛事光环境难题 - 资讯焦点
  • 机器学习结合提丢斯-波得定则预测系外行星与宜居带候选体
  • AI重塑食品系统:从精准预测到个性化营养的实践路径
  • AI Agent可靠性评估:核心维度与最佳实践
  • CANN算子高性能实战样例库
  • 医疗AI公平性:从算法偏见根源到全链路治理的实践指南
  • 2026年昆明曲靖代理记账与工商变更全生命周期企业财税合规服务深度横评指南 - 年度推荐企业名录
  • 树莓派4B上Kali Linux安装RTL8812AU驱动的完整指南(含国内源优化)
  • AI生成虚假内容(FAIGC)的生成原理、检测技术与治理挑战
  • ChatGPT与CAQDAS融合:人机协同定性分析工作流实战指南