当前位置: 首页 > news >正文

CANN/ops-math 广播算子

BroadcastTo

【免费下载链接】ops-math本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-math

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品
Atlas 推理系列产品
Atlas 训练系列产品

功能说明

  • 算子功能:将输入tensor广播到指定的shape。如输入tensor的shape为(1, 4),指定的shape为(2, 4),则输出是shape为(2, 4)的tensor。

参数说明

参数名输入/输出/属性描述数据类型数据格式
x输入张量需要被广播的张量。BF16、FLOAT16、FLOAT、 DOUBLE、INT64、INT32、UINT8、UINT16、UINT32、UINT64、INT8、INT16、COMPLEX32、COMPLEX64、COMPLEX128、QINT8、QUINT8、QINT16、QUINT16、QINT32、BOOL、HIFLOAT8、FLOAT8_E5M2、FLOAT8_E4M3FN、STRINGND
shape输入张量表示 x 广播后的shape大小。INT64、INT32-
y输出维度最大不超过8维,shape由shape输入决定,dtype需要与self一致。同 xND

约束说明

调用说明

调用方式样例代码说明
图模式调用test_geir_broadcast_to通过算子IR构图方式调用broadcast_to算子。

【免费下载链接】ops-math本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-math

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/786857/

相关文章:

  • 《龙虾OpenClaw系列:从嵌入式裸机到芯片级系统深度实战60课》039、原子操作与内存屏障:多核同步的硬件原语
  • MCPal:基于MCP协议为AI助手构建原生桌面通知系统
  • CANN运行时TDT通道容量示例
  • 基于Agent-as-a-Service架构的多智能体编排平台设计与实现
  • ARM指令集开发与SVC/SWP指令实战指南
  • AI+MrP:大语言模型与偏差校正融合的民意调查新范式
  • Godot双网格瓦片地图系统:实现逻辑与渲染分离的2D地图架构
  • CANN逆排列算子文档
  • Rust内存布局深度解析:从栈到堆的高效管理
  • 一文讲透 .NET 中的 `GetHashCode`:从一段错误的去重代码说起
  • Helm Charts 实战:从用户视角构建生产就绪的Kubernetes应用部署模板
  • 2026年比较好的纯氮气保护铝钎焊炉公司哪家好 - 行业平台推荐
  • AI Agent安全审计实战:开源工具Have I Been Clawned深度解析
  • 提示工程实战指南:从核心心法到工程化落地
  • 为Claude Code编程助手配置稳定可靠的API后端服务
  • 基于Helm与Kubernetes的5G核心网云原生部署实践
  • ai应用开发中如何利用多模型能力提升系统鲁棒性
  • 为Cursor编辑器打造专属浅色主题:从色彩体系到实践应用
  • 2026年05月09日最热门的开源项目(Github)
  • ArkUI电商首页完整实战
  • CANN/ATVOSS块调度运行接口
  • 人与人的四种差别
  • 5分钟学会:无需越狱导出iOS微信聊天记录的终极方案
  • Hyprland高效截图工具链:集成hyprshot、swappy与pngquant的一键工作流
  • ARM GICv3虚拟化架构与ICH_LR寄存器解析
  • 从零搭建轻量级夜间构建系统:基于Docker与Cron的自动化实践
  • AI应用测试工程2026:如何系统化测试你的LLM应用
  • 基于Vue 3与Vite的快速后台管理框架:fast-soy-admin深度解析
  • 在Taotoken控制台中清晰追踪项目成本与各模型消耗明细
  • BLDC电机控制原理与PID优化实践