当前位置: 首页 > news >正文

CANN/tensorflow迭代循环设置API

set_iteration_per_loop

【免费下载链接】tensorflowAscend TensorFlow Adapter项目地址: https://gitcode.com/cann/tensorflow

功能说明

设置sess.run模式下小循环次数,即每次sess.run()在Device侧执行训练迭代的次数,可以减少Host与Device间的交互次数,缩短训练时长。

函数原型

def set_iteration_per_loop(sess, train_op, iterations_per_loop=1)

参数说明

参数名输入/输出描述
sess输入已经创建的TensorFlow会话。
train_op输入更新梯度的操作。
iterations_per_loop输入每次sess.run(),在Device侧执行训练迭代的次数,默认为1,且训练迭代总次数必须为iterations_per_loop的整数倍。
混合计算模式(mix_compile_mode为True)时,iterations_per_loop必须为1。

返回值

返回一个算子,供用户通过sess.run(op)调用。

约束说明

由于该接口中有改图的操作,如果图无法修改(例如冻结了图或者使用tf.train.Supervisor创建session等),则无法使用set_iteration_per_loop接口设置大小循环。此种情况下请使用create_iteration_per_loop_var和load_iteration_per_loop_var。

调用示例

from npu_bridge.npu_init import * config = tf.ConfigProto(allow_soft_placement=True) custom_op = config.graph_options.rewrite_options.custom_optimizers.add() custom_op.name = "NpuOptimizer" custom_op.parameter_map["enable_data_pre_proc"].b = True # 若网络中存在GetNext算子,需要设置GetNext算子下沉,GetNext算子下沉是迭代循环下沉的必要条件 custom_op.parameter_map["iterations_per_loop"].i = 10 # 此处设置的值和set_iteration_per_loop接口设置的iterations_per_loop参数值保持一致,用于判断是否进行训练迭代下沉 config = npu_config_proto(config_proto=config) # 训练模型 with tf.Session(config=config) as sess: sess.run(init) # sess.run模式下设置小循环次数为10 train_op = util.set_iteration_per_loop(sess, optimizer, 10) # 其中sess为TensorFlow会话,optimizer为更新梯度的操作,10为设置的在Device侧进行训练迭代的次数 for epoch in range(training_epochs): avg_cost = 0 total_batch = int(mnist.train.num_examples / batch_size) for i in range(total_batch): batch_xs, batch_ys = mnist.train.next_batch(batch_size) _, c = sess.run([train_op, cost], feed_dict={x: batch_xs, y: batch_ys}) avg_cost += c / total_batch

【免费下载链接】tensorflowAscend TensorFlow Adapter项目地址: https://gitcode.com/cann/tensorflow

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/788420/

相关文章:

  • 从零构建个人命令行工具集:基于Node.js与Commander.js的插件化架构实践
  • DeepMesh:基于Transformer与强化学习的点云到高质量网格生成技术详解
  • 3步掌握FunClip智能视频剪辑:为什么选择这款开源工具能让你效率翻倍?
  • 基于Stable Diffusion与AnimateDiff的AI动画生成实战指南
  • 终极指南:3步轻松解锁QQ音乐加密文件,macOS用户的完整解决方案
  • 【12.MyBatis源码剖析与架构实战】MyBatis与设计模式-8. 组合模式
  • K8s 核心资源详解(Pod/Deployment/Service 实战)
  • 2026年华铁智能科技性价比排名 - mypinpai
  • B站视频转文字终极指南:3分钟学会用AI高效提取视频内容
  • 火爆分享的AI应用背后,如何用Taotoken实现稳定低成本的API调用
  • 智能空间架构解析:从多模态感知到智能体协同的AI环境构建
  • WELearn网课助手终极指南:告别熬夜刷课,5分钟实现学习自由
  • 机器学习模型漂移检测实战:从数据漂移到概念漂移的监控与应对
  • AI编码助手本地技能库:实现项目专属智能开发环境
  • 实验揭示:大语言模型委托工作不可靠,前沿模型平均损坏 25% 文档内容
  • qmcdump终极指南:5分钟快速解密QQ音乐加密格式的完整解决方案
  • Dell G15散热控制终极指南:3分钟告别AWCC卡顿与臃肿
  • 【12.MyBatis源码剖析与架构实战】MyBatis与设计模式-10. 责任链模式
  • 从零构建角色定制应用:技术架构、核心难点与实现方案
  • 影刀RPA企业级店群自动化架构:多浏览器并发与核心业务防泄密实战
  • FunClip视频剪辑终极指南:3分钟快速上手AI智能剪辑
  • CANN/cann-recipes-train:基于verl框架和代码沙盒环境的代码强化学习实践
  • 声明式CLI交互工具cli-jaw:构建优雅命令行界面的新范式
  • 【毕业设计项目】大数据文献综述管理系统:Hadoop/Spark 选题库、参考文献、LaTeX 提交与评分统计
  • 3个实战场景:用Windows Cleaner专业解决Windows系统空间管理难题
  • LlamaPen:基于Web的Ollama图形化界面,实现本地大模型高效交互
  • Parsec VDD虚拟显示器深度解析:从架构设计到性能调优的完整指南
  • QMCDecode:3步解锁QQ音乐加密格式,让音乐文件重获自由
  • 为OpenClaw AI工作流注入安全审计能力:trust-openclaw实战指南
  • 基于FPGA硬件加速的ANN体温检测系统:从算法到芯片的完整实现