当前位置：首页 > news >正文

CANN/cann-samples HiFloat8介绍

news 2026/7/4 4:35:52

HiFloat8介绍

【免费下载链接】cann-samples算子领域高性能实战演进样例与体系化调优知识库项目地址: https://gitcode.com/cann/cann-samples

简要描述

HiFloat8（以下简称HiF8）是一种适用于深度学习的创新性8位浮点数据格式。HiF8采用梯度精度设计：在常规值编码模式下，提供7个3位尾数位指数值、8个2位尾数位指数值以及16个1位尾数位指数值。对于非标准值编码，它通过额外增加7个2的幂次将动态范围从31扩展至38位二进制数（需注意FP16覆盖40位二进制数）。同时，HiF8编码了所有特殊值，但正零和负零仅由单一比特模式表示。得益于精度与动态范围的更佳平衡，HiF8可同时应用于AI训练的前向与后向传播。

设计实现

详细介绍参考以下论文

Ascend HiFloat8 Format for Deep Learning

支持架构

NPU ARCH 3510

算子实践

// 在算子开发中不感知 HIF8 类型转换的具体计算逻辑。根据实际需求，将对应输入/输出的数据类型设置为 hifloat8_t 即可。 // 支持创建数据类型为 hifloat8_t 的 GM 和 UB AscendC::GlobalTensor<hifloat8_t> yGm; yGm.SetGlobalBuffer((__gm__ hifloat8_t *)y, TOTAL_LENGTH); AscendC::LocalTensor<hifloat8_t> yLocal = outQueueY.AllocTensor<hifloat8_t>(); AscendC::LocalTensor<float> tmpLocal = tmpCalc.Get<float>(); // 直接使用 AscendC::Cast API 进行类型转换，无需额外操作 AscendC::Cast<hifloat8_t, float>(yLocal, tmpLocal, AscendC::RoundMode::CAST_ROUND, TOTAL_LENGTH); // DataCopy时按照每个数据 1 Byte 计算搬运量，正常搬出即可 outQueueY.EnQue<hifloat8_t>(yLocal); AscendC::LocalTensor<hifloat8_t> yOutput = outQueueY.DeQue<hifloat8_t>(); AscendC::DataCopy(yGm, yOutput, TOTAL_LENGTH);

算子样例

Quantize算子

算子功能：
Quantize算子实现将数据量化为Hifloat8类型的功能。
算子规格：
算子类型(OpType) Quantize
算子输入 name shape data type format
x 1 * 2048 float32 ND
scale 1 * 2048 float32 ND
offset 1 * 2048 float32 ND
算子输出 y 1 * 2048 hifloat8 ND
核函数名 quantize_custom
计算公式：
```
y = (x / scale + offset).to(hifloat8)
```

样例执行

# 根据 ${git_clone_path}/README.md 编译Samples仓的所有执行用例 # 安装后目录结构保持与源码一致，scripts/ 目录会被保留 cd build_out/1_Features/hardware_features/hif8 # 进入hif8的build结果目录 python3 scripts/gen_data.py # 生成测试输入数据 ./quantize_hif8_demo # 执行编译生成的可执行程序，执行样例 python3 scripts/verify_result.py output/output_y.bin output/golden_y.bin # 验证输出结果是否正确，确认算法逻辑正确

如果看到以下执行结果，说明精度对比成功。

test pass

【免费下载链接】cann-samples算子领域高性能实战演进样例与体系化调优知识库项目地址: https://gitcode.com/cann/cann-samples

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

查看全文

http://www.jsqmd.com/news/784707/

快手去水印免费软件有哪些？快手如何去掉水印？2026最新实测免费工具推荐 - 爱上科技热点

CANN/ops-math MaskedSelectV3算子

河北联邦外国语学校2026年最新学费及配套价值实测评测 - 奔跑123

2026年4月行业内诚信的激光熔覆厂家推荐，激光熔覆，激光熔覆工厂怎么选择 - 品牌推荐师

考临床执医听谁的课？零基础、在职考生匹配适合自己的阿虎老师 - 医考机构品牌测评专家

鸿蒙PC多端适配的断点设计与布局策略

CANN/ge RT2运行时约束

高质量开放数据源指南：生命科学、零售与物流领域实战解析

佛山黄金回收上门天花板！收的顶30年老店垄断TOP1，免费上门秒到账 - 奢侈品回收测评

行业标杆之作！2026广州晶石压电式石英传感器，重新定义传感设备品质标准 - 品牌速递

AI伦理挑战：从数据偏见、环境成本到治理困境的深度解析

鸿蒙pc中权限申请流程与用户拒绝处理

质量好+服务优！2026广州晶石不停车高速超限检测系统，成为行业推荐之选 - 品牌速递

多款去水印软件测评选出去除效果干净的工具 - 爱上科技热点

perf热点找到热进程5 - 小镇

AI赋能法律行业：从大模型到司法实践的技术路径与挑战

品牌营销全案策划公司三巨头 - 品牌速递

使用taotoken后我的大模型api调用延迟与稳定性体感观察

快手去水印免费软件有哪些？手机版电脑版都能用的去水印工具 2026 实测推荐技巧 - 爱上科技热点

CANN/ops-tensor项目目录

2026工业超声波搅拌机/搅拌罐选购指南：核心要点与优质品牌全解析 - 品牌推荐大师1

2026石英称重传感器品牌排行榜，广州晶石领跑行业 - 品牌速递

《什么是文档 Diff？5 分钟搞懂文件比对的核心原理》

多模态AGI在教育领域的应用：从文本理解到视觉生成的智能助教

2026年全国控制阀厂家哪家好适配高端工况与普通场景聚焦技术与服务 - 深度智识库

为Claude Code配置Taotoken后端，解决封号与token不足问题

多模态对比学习中的信息解耦：FACTORCL原理、实现与调优指南

算子类型(OpType)	Quantize
算子输入	name	shape	data type	format
	x	1 * 2048	float32	ND
	scale	1 * 2048	float32	ND
	offset	1 * 2048	float32	ND
算子输出	y	1 * 2048	hifloat8	ND
核函数名	quantize_custom