当前位置: 首页 > news >正文

偏导数

🧮 偏导数:直观理解与核心用法

偏导数是多变量函数里的 “变化率”,它的核心思想是:只看一个变量的变化对函数值的影响,同时把其他变量都固定住


1. 从普通导数到偏导数

  • 普通导数:适用于单变量函数,比如 y=f(x),导数 dxdy​ 表示当 x 变化时,y 变化的快慢。
  • 偏导数:适用于多变量函数,比如 z=f(x,y),偏导数 ∂x∂z​ 表示:固定 y 不变时,x 变化一点点会导致 z 变化多少

生活例子

假设你的成绩 z 由学习时间 x 和睡眠时长 y 共同决定:z=f(x,y)。

  • ∂x∂z​:固定睡眠时长 y,看学习时间 x 增加 1 小时,成绩 z 能提升多少。
  • ∂y∂z​:固定学习时间 x,看睡眠时长 y 增加 1 小时,成绩 z 能提升多少。

2. 数学定义与计算

对于函数 z=f(x,y):

∂x∂z​=limΔx→0​Δxf(x+Δx,y)−f(x,y)​

∂y∂z​=limΔy→0​Δyf(x,y+Δy)−f(x,y)​

计算规则

计算 ∂x∂z​ 时,把 y 当成常数,只对 x 求导;

计算 ∂y∂z​ 时,把 x 当成常数,只对 y 求导。

例子

z=x2+3xy+y3

  • 对 x 求偏导(把 y 看作常数):

    ∂x∂z​=2x+3y

  • 对 y 求偏导(把 x 看作常数):

    ∂y∂z​=3x+3y2


3. 偏导数在深度学习里的作用

在神经网络中,损失函数 Q(w) 是所有权重 w1​,w2​,…,wn​ 的函数。

  • 偏导数 ∂wi​∂Q​ 表示:固定其他所有权重不变时,权重 wi​ 变化一点点会导致损失 Q 变化多少
  • 这个值的正负告诉我们:增大 wi​ 会让损失变大还是变小;绝对值大小告诉我们影响的程度。
  • 所有偏导数组成的向量,就是梯度 ∇Q(w)。

反向传播的本质

就是用链式法则,逐层计算损失函数对每一个权重的偏导数,最终得到整个梯度向量。


4. 关键区别

普通导数 偏导数
单变量函数 多变量函数
符号:dxdy​ 符号:∂x∂z​
描述一个变量的变化率 描述 “一个变量变化、其他固定” 时的变化率

🧠 示例:简单的两层神经网络

我们用一个非常直观的例子来拆解反向传播的每一步。

1. 网络结构

  • 输入:x=2
  • 隐藏层权重:w1​=0.5,偏置:b1​=0.1
  • 激活函数:sigmoid σ(z)=1+e−z1​
  • 输出层权重:w2​=0.3
  • 真实标签:y=1

2. 前向传播(计算预测值与损失)

  1. 隐藏层输入

    z=w1​⋅x+b1​=0.5×2+0.1=1.1

  2. 隐藏层输出(激活后)

    a=σ(z)=1+e−1.11​≈0.7503

  3. 最终预测值

    y^​=w2​⋅a=0.3×0.7503≈0.2251

  4. 损失函数(均方误差)

    Q=(y^​−y)2=(0.2251−1)2≈0.6006


3. 反向传播(计算每个权重的偏导数)

我们的目标是求出 ∂w2​∂Q​ 和 ∂w1​∂Q​,这就是损失对权重的偏导数。

步骤 1:计算损失对输出层权重 w2​ 的偏导数

∂w2​∂Q​=∂y​∂Q​⋅∂w2​∂y​​

  • ∂y​∂Q​=2(y​−y)≈2(0.2251−1)=−1.5498

  • ∂w2​∂y^​​=a≈0.7503

  • 所以:

    ∂w2​∂Q​≈−1.5498×0.7503≈−1.1628


步骤 2:计算损失对隐藏层权重 w1​ 的偏导数

这一步需要多层链式法则:

∂w1​∂Q​=∂y​∂Q​⋅∂a∂y​​⋅∂z∂a​⋅∂w1​∂z​

  • ∂y^​∂Q​≈−1.5498(已算)
  • ∂a∂y^​​=w2​=0.3
  • ∂z∂a​=σ(z)(1−σ(z))≈0.7503×(1−0.7503)≈0.1873
  • ∂w1​∂z​=x=2

代入计算:

∂w1​∂Q​≈−1.5498×0.3×0.1873×2≈−0.1764


4. 梯度与权重更新

现在我们得到了梯度向量:

∇Q=[∂w1​∂Q​,∂w2​∂Q​]≈[−0.1764,−1.1628]

假设学习率 η=0.1,用梯度下降公式更新权重:

w1new​=w1​−η⋅∂w1​∂Q​≈0.5−0.1×(−0.1764)=0.5176

w2new​=w2​−η⋅∂w2​∂Q​≈0.3−0.1×(−1.1628)=0.4163

嘿嘿,还是没看懂

http://www.jsqmd.com/news/1026104/

相关文章:

  • 2026年 重庆次氯酸钠工业与消毒级水处理药剂,实力源头厂家深度评估 - 企业推荐官【官方】
  • 自动门厂家怎么选?2026最新TOP榜解析 - 资讯快报
  • CAD图纸识别踩坑记:手动审了3天,AI跑了20分钟
  • ASP.NET MVC解决方案结构设计:从分层陷阱到业务垂直切片
  • 从OpenSSH升级到兼容老旧系统:一次‘密钥交换失败’引发的SSH算法兼容性深度探讨
  • Mysql:实用工具:解密【.mylogin.cnf】的python小工具
  • Sagacity博客解析:技术写作的认知脚手架与可验证知识体系
  • PostgreSQL 技术日报 (6月16日)|Neon 自动化再进一步,逻辑复制冲突日志迎来 v50 更新
  • 2026 广州新房卫生间漏水找谁靠谱?收集 5 家本地正规防水企业业主真实评价 - 防水资讯
  • 你的UDS 27服务测试卡在哪了?详解CANoe中CDD配置与DLL算法调用的那些坑
  • Java毕设选题推荐:基于 SpringBoot 的餐饮成本核算与利润分析系统设计 智慧餐饮视角下财务数据运维管理系统设计与实现【附源码、mysql、文档、调试+代码讲解+全bao等】
  • 2026华东定制特种线缆TOP企业评测:核心选型维度与避坑指南 - 资讯快报
  • 称重传感器选购注意事项:广东犸力在商业结算中零误差 - 品牌速递
  • 2026 武汉梅雨季卫生间漏水频繁复发怎么办?对比 5 家本地专业防水公司 - 防水资讯
  • 京东 E 卡回收流程完整攻略|正规礼品卡回收平台推荐 + 避坑干货 - 资讯快报
  • 2026 温州常年多雨卫生间泡水漏水维修?深度测评 5 家本地防水维修商家 - 防水资讯
  • DiskSpd终极指南:微软官方存储性能测试工具完整教程
  • 初创公司数据栈五大陷阱:从工具泛滥到组织割裂
  • 2026南昌高净值人群离婚财产纠纷解决方案:8位资深婚姻家事律师专业推荐 - 资讯快报
  • 2026年6月最新天梭中国官方售后电话地址服务热线客服网点 - 资讯快报
  • 终极虚幻引擎存档编辑指南:uesave如何让你轻松掌控游戏进度
  • 2026武汉空调维修-中央空调维修加氟安装正规服务商推荐( 全武汉可上门)-修乐家 - 资讯快报
  • QorIQ平台安全启动与NetPDL自定义协议开发实战指南
  • 丽江目的地婚礼怎么预订?完整流程指南 - 资讯快报
  • 泉州搬家物流需求痛点与选型指南 - 资讯快报
  • 2026年 东莞汉堡盒源头工厂推荐榜单:严选品质与环保工艺实力派厂家深度解析 - 品牌发掘
  • 气候AI落地实战:小模型+物理约束+边缘部署
  • 2026年国内论文辅导机构口碑实测汇总,硕博圈公认靠谱榜单 - 刚达R
  • 2026年线上投票工具实测:5款平台对比,按需挑选更省心
  • okbiye 一站式毕业论文 AI 创作工具|解决本科硕博论文撰写全流程痛点,高效完成规范高质毕业文稿