当前位置: 首页 > news >正文

CANN / docs - 配置精度模式

配置精度模式

【免费下载链接】docs该仓库用于维护cann公共文档项目地址: https://gitcode.com/cann/docs

如果在模式转换时不指定网络模型或算子的精度模式,默认采用fp16(float16)数据类型进行计算。

配置模型高精度模式后推理,可提升精度,但可能会影响推理性能,如果在精度达标的同时,需要保持性能,则可以配置部分算子保持原始网络中的数据类型。

配置网络模型的高精度模式

  1. 使用ATC工具转换模型时,增加高级参数--precision_mode,用于指定精度模式。

    参数设置如下所示,表示如果网络模型中算子支持fp32(float32),则使用fp32;如果网络模型中算子不支持fp32,则使用fp16(float16)。

    --precision_mode=allow_fp32_to_fp16

    关于该参数的详细说明请参见《ATC离线模型编译工具》中的“参数说明 > 高级功能参数 > 算子调优选项 > --precision_mode”。

  2. 使用转换后的om模型重新推理。

配置部分算子保持原始网络中的数据类型

  1. 使用ATC工具转换模型时,增加高级参数--keep_dtype(指定部分算子计算时保持原始网络的数据类型)和--precision_mode(指定网络模型的精度模式)。

    参数使用示例如下:

    --keep_dtype=$HOME/exceptionlist.cfg --precision_mode=force_fp16

    配置文件名举例为_exceptionlist.cfg_,配置文件样例如下,文件中每一行是一个算子的名称,将配置好的_exceptionlist.cfg_文件上传到ATC工具所在服务器任意目录:

    Opname1 Opname2 …

    关于该参数的详细说明请参见《ATC离线模型编译工具》中的“参数说明 > 高级功能参数 > 算子调优选项 > --keep_dtype”。

  2. 使用转换后的om模型重新推理。

【免费下载链接】docs该仓库用于维护cann公共文档项目地址: https://gitcode.com/cann/docs

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1130568/

相关文章:

  • 线程池常规使用 以及 基本的信息
  • Self-Parking Car Evolution:如何使用遗传算法让汽车学会自动泊车
  • CANN Ascend C矩阵乘Tiling baseM值获取
  • 理解原子变量之三:原子性与memory_order_relaxed
  • 传统工具 vs Slidev 对比
  • YOLOv5 火焰识别实战:1421张数据集训练,mAP@0.5 达 0.89(附完整代码)
  • SmartTube完整教程:3步在Android TV上安装无广告YouTube客户端
  • 无需Root!三步法让安卓手机告别臃肿,快速提升隐私与续航的终极方案
  • CCHMapClusterController高级技巧:动态聚类控制与多组聚类管理
  • 【 LM358AD方波】2024-12-31
  • Buildout PYTHONPATH接管机制导致子进程模块导入失败
  • Word2Bits预训练模型下载与应用:800维1位量化向量高效部署指南
  • Sync源码解析:深入理解Erlang自动重载工具的架构设计
  • 从零实现Google OAuth 2.0登录:Node.js后端集成与安全实践
  • Git删除文件安全指南:从暂存区清理到历史重写
  • Twitter API Client测试策略:单元测试与集成测试完整指南
  • twitter-api-php测试策略:使用PHPUnit进行API集成测试
  • 解决CSM联机延迟:提升《城市:天际线》多人游戏体验的10个实用技巧
  • SageMaker Studio Lab部署指南:将训练好的模型无缝集成到AWS服务
  • icanhazproxy.com使用指南:如何快速检测与分析HTTP代理头信息
  • 如何快速上手intellij-erlang?5分钟完成Erlang IDE搭建指南
  • Wexflow安全部署指南:保护你的自动化流程免受攻击
  • 3分钟掌握Android投屏神器:scrcpy让手机屏幕完美显示在电脑上
  • AcDisplay Xposed模块开发:如何扩展Android系统级通知功能
  • 5步掌握GTA5最强修改器:YimMenu终极使用指南
  • CANN/asc-devkit多核矩阵乘法临时缓冲区大小获取
  • 革命性开源天气API:Open-Meteo如何重塑全球气象数据访问
  • 零代码革命:如何用MIT App Inventor在3天内开发出你的第一个移动应用?
  • 如何利用MONAI解决医疗影像AI开发中的核心挑战:模块化设计与实战应用
  • 3步解锁PPT科研演示效率:SlideSCI插件终极解决方案