当前位置: 首页 > news >正文

pytorch深度学习笔记12

目录

摘要

输出层的反向传播和实现


摘要

本篇文章继续学习尚硅谷深度学习教程,学习内容是输出层的反向传播和代码实现

输出层的反向传播和实现

在输出层,我们一般使用Softmax作为激活函数。

对于Softmax函数:

其偏导数为:

而对于输出层,一般会直接将结果代入损失函数的计算。对于我们之前介绍的分类问题,这里选择交叉熵误差(Cross Entropy Error)作为损失函数,就可以得到一个Softmax-with-Loss层,它包含了Softmax和Cross Entropy Loss两部分。

导数的计算会比较复杂,可以用计算图表示如下:

简化得:

在代码中可以实现为一个类 SoftmaxWithLoss:

class SoftmaxWithLoss: def __init__(self): self.loss = None self.y = None # softmax的输出 self.t = None # 监督数据 def forward(self, x, t): self.t = t self.y = softmax(x) self.loss = cross_entropy_error(self.y, self.t) return self.loss def backward(self, dout=1): batch_size = self.t.shape[0] if self.t.size == self.y.size: # 监督数据是one-hot-vector的情况 dx = (self.y - self.t) / batch_size else: dx = self.y.copy() dx[np.arange(batch_size), self.t] -= 1 dx = dx / batch_size return dx
http://www.jsqmd.com/news/221433/

相关文章:

  • PDF编辑神器,免费国际版
  • T触发器时序行为深度剖析:建立与保持时间详解
  • DUT功能验证中的断言使用技巧:实战经验分享
  • 开发一款APP费用是多少?影响价格的几大核心因素
  • T触发器时序行为深度剖析:建立与保持时间详解
  • Elasticsearch资源隔离配置教程
  • 图解说明:PyTorch推荐系统中的Embedding层设计
  • 入驻爱发电
  • 一文搞懂RLHF (基于人类反馈的强化学习)
  • 利用udev规则屏蔽工业Linux系统中的未知USB设备(设备描述)
  • 三维动态避障路径规划:基于融合DWA的部落竞争与成员合作算法(CTCM)求解无人机三维动态避障路径规划研究,MATLAB代码
  • OpenAI推出ChatGPT Health医疗问答功能
  • AI 赋能学术:paperxie 毕业论文写作功能,让硕士 3 万字论文从选题到成稿更高效
  • 丘成桐数学科学领军人才培养计划毕业后安排和薪资
  • 完整回放|上海创智/TileAI/华为/先进编译实验室/AI9Stars深度拆解 AI 编译器技术实践
  • Anthropic寻求3500亿美元估值融资100亿美元
  • 新手教程:如何正确驱动无源蜂鸣器发声
  • 工业控制场景下QSPI协议通信稳定性深度剖析
  • 打卡信奥刷题(2666)用C++实现信奥题 P2863 [USACO06JAN] The Cow Prom S
  • DDOIProxy.dll文件丢失找不到问题 免费下载方法分享
  • CES 2026 | 重大更新:NVIDIA DGX Spark开启“云边端”模式
  • es客户端查询DSL在日志系统中的应用:全面讲解
  • LeetCode 470 用 Rand7() 实现 Rand10()
  • WaitMutex -FromMsBuild -architecture=x64”已退出,代码为 6
  • 通俗解释nmodbus4在自动化产线中的角色
  • 工业现场声音报警实现:有源蜂鸣器和无源区分手把手教程
  • Gmail新增Gemini驱动AI功能,智能优先级和摘要来袭
  • 【Zabbix 多渠道报警全攻略(附图文教程):钉钉 / 企微 / 飞书 / 邮箱配置,含前置环境搭建(监控项、触发器、脚本与动作创建)、完整配置流程(脚本添加、媒介创建、关联授权)与功能测试】
  • 逻辑回归中的条件概率
  • 从零实现:搭建ARM64蓝屏调试环境并进行WinDbg分析