当前位置: 首页 > news >正文

CANN/cann-samples HiFloat8介绍

HiFloat8介绍

【免费下载链接】cann-samples算子领域高性能实战演进样例与体系化调优知识库项目地址: https://gitcode.com/cann/cann-samples

简要描述

HiFloat8(以下简称HiF8)是一种适用于深度学习的创新性8位浮点数据格式。HiF8采用梯度精度设计:在常规值编码模式下,提供7个3位尾数位指数值、8个2位尾数位指数值以及16个1位尾数位指数值。对于非标准值编码,它通过额外增加7个2的幂次将动态范围从31扩展至38位二进制数(需注意FP16覆盖40位二进制数)。同时,HiF8编码了所有特殊值,但正零和负零仅由单一比特模式表示。得益于精度与动态范围的更佳平衡,HiF8可同时应用于AI训练的前向与后向传播。

设计实现

详细介绍参考以下论文

Ascend HiFloat8 Format for Deep Learning

支持架构

NPU ARCH 3510

算子实践

// 在算子开发中不感知 HIF8 类型转换的具体计算逻辑。根据实际需求,将对应输入/输出的数据类型设置为 hifloat8_t 即可。 // 支持创建数据类型为 hifloat8_t 的 GM 和 UB AscendC::GlobalTensor<hifloat8_t> yGm; yGm.SetGlobalBuffer((__gm__ hifloat8_t *)y, TOTAL_LENGTH); AscendC::LocalTensor<hifloat8_t> yLocal = outQueueY.AllocTensor<hifloat8_t>(); AscendC::LocalTensor<float> tmpLocal = tmpCalc.Get<float>(); // 直接使用 AscendC::Cast API 进行类型转换,无需额外操作 AscendC::Cast<hifloat8_t, float>(yLocal, tmpLocal, AscendC::RoundMode::CAST_ROUND, TOTAL_LENGTH); // DataCopy时按照每个数据 1 Byte 计算搬运量,正常搬出即可 outQueueY.EnQue<hifloat8_t>(yLocal); AscendC::LocalTensor<hifloat8_t> yOutput = outQueueY.DeQue<hifloat8_t>(); AscendC::DataCopy(yGm, yOutput, TOTAL_LENGTH);

算子样例

Quantize算子

  • 算子功能:
    Quantize算子实现将数据量化为Hifloat8类型的功能。

  • 算子规格:

    算子类型(OpType)Quantize
    算子输入nameshapedata typeformat
    x1 * 2048float32ND
    scale1 * 2048float32ND
    offset1 * 2048float32ND
    算子输出y1 * 2048hifloat8ND
    核函数名quantize_custom
  • 计算公式:

    y = (x / scale + offset).to(hifloat8)
  • 样例执行

    # 根据 ${git_clone_path}/README.md 编译Samples仓的所有执行用例 # 安装后目录结构保持与源码一致,scripts/ 目录会被保留 cd build_out/1_Features/hardware_features/hif8 # 进入hif8的build结果目录 python3 scripts/gen_data.py # 生成测试输入数据 ./quantize_hif8_demo # 执行编译生成的可执行程序,执行样例 python3 scripts/verify_result.py output/output_y.bin output/golden_y.bin # 验证输出结果是否正确,确认算法逻辑正确

    如果看到以下执行结果,说明精度对比成功。

    test pass

【免费下载链接】cann-samples算子领域高性能实战演进样例与体系化调优知识库项目地址: https://gitcode.com/cann/cann-samples

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/784707/

相关文章:

  • 快手去水印免费软件有哪些?快手如何去掉水印?2026最新实测免费工具推荐 - 爱上科技热点
  • CANN/ops-math MaskedSelectV3算子
  • 河北联邦外国语学校2026年最新学费及配套价值实测评测 - 奔跑123
  • 2026年4月行业内诚信的激光熔覆厂家推荐,激光熔覆,激光熔覆工厂怎么选择 - 品牌推荐师
  • 考临床执医听谁的课?零基础、在职考生匹配适合自己的阿虎老师 - 医考机构品牌测评专家
  • 鸿蒙PC多端适配的断点设计与布局策略
  • CANN/ge RT2运行时约束
  • 2026年园林古建筑工程公司最新推荐榜:古建修缮/仿古建材供应/古建安装/景观古建/古建装饰 - 海棠依旧大
  • 高质量开放数据源指南:生命科学、零售与物流领域实战解析
  • 佛山黄金回收上门天花板!收的顶30年老店垄断TOP1,免费上门秒到账 - 奢侈品回收测评
  • 行业标杆之作!2026广州晶石压电式石英传感器,重新定义传感设备品质标准 - 品牌速递
  • AI伦理挑战:从数据偏见、环境成本到治理困境的深度解析
  • 鸿蒙pc中权限申请流程与用户拒绝处理
  • 质量好+服务优!2026广州晶石不停车高速超限检测系统,成为行业推荐之选 - 品牌速递
  • 即梦AI视频怎么去水印?2026最新手机去水印最实用方法全解析 - 爱上科技热点
  • 多款去水印软件测评 选出去除效果干净的工具 - 爱上科技热点
  • perf热点找到热进程5 - 小镇
  • AI赋能法律行业:从大模型到司法实践的技术路径与挑战
  • 品牌营销全案策划公司三巨头 - 品牌速递
  • 使用taotoken后我的大模型api调用延迟与稳定性体感观察
  • 快手去水印免费软件有哪些?手机版电脑版都能用的去水印工具 2026 实测推荐技巧 - 爱上科技热点
  • CANN/ops-tensor项目目录
  • 2026工业超声波搅拌机/搅拌罐选购指南:核心要点与优质品牌全解析 - 品牌推荐大师1
  • 2026石英称重传感器品牌排行榜,广州晶石领跑行业 - 品牌速递
  • 2026年上海嘉定装修服务商最新推荐:上海合饰装饰设计工程,嘉定家装、嘉定老房翻新、嘉定全屋整装,以靠谱服务守护居家品质 - 海棠依旧大
  • 《什么是文档 Diff?5 分钟搞懂文件比对的核心原理》
  • 多模态AGI在教育领域的应用:从文本理解到视觉生成的智能助教
  • 2026年全国控制阀厂家哪家好 适配高端工况与普通场景 聚焦技术与服务 - 深度智识库
  • 为Claude Code配置Taotoken后端,解决封号与token不足问题
  • 多模态对比学习中的信息解耦:FACTORCL原理、实现与调优指南