当前位置: 首页 > news >正文

反向传播的计算顺序

反向传播的前提条件是:假如前向传播的时候变量B、C、D直接依赖于变量A,而变量A又直接依赖于A’,那么反向传播计算变量A’的梯度的时候,必须先计算得到B、C、D的梯度,从而得到正确的变量A的梯度,然后再计算变量A’的梯度。

以上图为例,假如t1、t2、t3、t4、t5都是中间变量,Fa、Fb、Fc、Fd、Fh都是计算函数,那么在计算t1的偏导的时候,必须先计算完t2的偏导,而t2的偏导又依赖于t3、t4、t5的偏导,所以在反向传播的时候,计算顺序必须是Fh->Fc->Fd->Fb->Fa。假如计算顺序是Fh->Fb->Fa,那么由于t2的偏导没有依赖t3、t5的偏导,因此计算出来的的t1的偏导也是错误的。

计算图和拓扑排序:计算图的本质是依赖关系,节点的入度代表其依赖的变量数,入度为0则代表该函数的输入变量已经被计算完毕。因此如果按照反向传播计算图的拓扑排序顺序来进行反向传播的话,计算每个backward函数的时候,其输入依赖项都已经被计算完毕(毕竟拓扑排序的定义就是:如果A指向B,那么A必然在B前面,因此开始计算某个函数F的时候,指向F的函数必然已经被计算),因此计算Fb的梯度必然在Fa的梯度计算之前被计算完毕,从而保证了计算的准确性。


而前向计算图的箭头反转就是反向传播的计算图,因此反向传播的顺序是前向传播计算图拓扑排序的逆序。另外一方面,所有需要计算梯度的变量都肯定和前向计算图中的箭头一一对应,而每个箭头又一定和某个计算节点对应,而拓扑排序包含了全体计算节点,因此通过拓扑排序的逆序来反向传播,必然能计算全部变量的梯度。

http://www.jsqmd.com/news/470655/

相关文章:

  • Hume: Introducing System-2 Thinking in Visual-Language-Action Model
  • OpenClaw爆火:AI执行革命背后的机遇与挑战
  • AI论文写作工具怎么选?2026年9款AI写论文工具亲测,职称论文高效完成!
  • 免费AI编辑器哪家强?AI微信编辑器免费的推荐深度解析告诉你。 - 鹅鹅鹅ee
  • 2026年企业选型必看:提升机厂家适配指南与四大核心能力实测分析 - 品牌推荐
  • 基于微信的居家养老小程序[小程序]-计算机毕业设计源码+LW文档
  • IO-Link 工业通信组合方案:SG-PN-IOL-8A-001 主站网关 + SG-IOL 系列集线器
  • 琻捷电子冲刺港交所:业绩增长背后的亏损隐忧与IPO挑战
  • RabbitMq高级篇
  • 计算机网络(七)-- 运输层 | TCP 流量控制 拥塞控制
  • 别拿粉尘不当威胁:方盾半面罩给你的肺多一层保护
  • 砂边倒角机哪家好?2026口碑厂商深度评测,底漆打磨机/双面抛光机/侧面打磨机/全自动洗板机,砂边倒角机制造厂家排行榜 - 品牌推荐师
  • Spring Boot 中关于 Bean 加载、实例化、初始化全生命周期的扩展点
  • ROS1+VINS-fusion+RTAB-Map 程序部署记录
  • 【干货】字节大佬:教培行业销售运营全景作战地图
  • 2026年苏州口碑好的家教老师联系方式,全托补习班/一对一家教试听课/师范家教/一对一/全托一对一,家教机构联系方式 - 品牌推荐师
  • 电子商务行业内哪个环节容易遇到攻击
  • UA-Glo® 荧光法细胞活力检测试剂盒技术原理与应用
  • 五:MySQL 索引使用优化指南:何时建、怎么建、怎么用
  • 虚幻引擎资源查看工具全面解析:从新手入门到高级应用实战指南
  • 2026年知名的ALD技术工厂推荐:ALD工艺开发/ALD原子层沉积高口碑品牌推荐 - 行业平台推荐
  • 联发科牵手星链:紧急警报直连太空
  • 2026年分期乐天虹提货券回收价格表 - 京回收小程序
  • 企业AI大脑是什么?企业落地前先回答的 5 个关键问题
  • AI写专著的秘密武器,实用工具大集合,开启高效写作模式
  • 揭秘AI专著撰写工具!功能对比分析,选对工具事半功倍
  • 代码反混淆实战指南:如何用AST技术快速还原JavaScript代码
  • 2026年热门的二轴程控平面磨床公司推荐:精密台湾型高精度平面磨床品牌厂家哪家靠谱 - 行业平台推荐
  • 掌握AI专著写作工具,快速生成创新性专著,提升学术影响力
  • 2026年口碑好的打包丝公司推荐:退火丝/黑色退火丝/退火调直丝厂家推荐哪家好 - 行业平台推荐