当前位置：首页 > news >正文

偏导数

news 2026/6/16 22:55:52

🧮 偏导数：直观理解与核心用法

偏导数是多变量函数里的 “变化率”，它的核心思想是：只看一个变量的变化对函数值的影响，同时把其他变量都固定住。

1. 从普通导数到偏导数

普通导数：适用于单变量函数，比如 y=f(x)，导数 dxdy 表示当 x 变化时，y 变化的快慢。
偏导数：适用于多变量函数，比如 z=f(x,y)，偏导数 ∂x∂z 表示：固定 y 不变时，x 变化一点点会导致 z 变化多少。

生活例子：

假设你的成绩 z 由学习时间 x 和睡眠时长 y 共同决定：z=f(x,y)。

∂x∂z：固定睡眠时长 y，看学习时间 x 增加 1 小时，成绩 z 能提升多少。
∂y∂z：固定学习时间 x，看睡眠时长 y 增加 1 小时，成绩 z 能提升多少。

2. 数学定义与计算

对于函数 z=f(x,y)：

∂x∂z=limΔx→0Δxf(x+Δx,y)−f(x,y)

∂y∂z=limΔy→0Δyf(x,y+Δy)−f(x,y)

计算规则：

计算 ∂x∂z 时，把 y 当成常数，只对 x 求导；

计算 ∂y∂z 时，把 x 当成常数，只对 y 求导。

例子：

z=x2+3xy+y3

对 x 求偏导（把 y 看作常数）：

∂x∂z=2x+3y
对 y 求偏导（把 x 看作常数）：

∂y∂z=3x+3y2

3. 偏导数在深度学习里的作用

在神经网络中，损失函数 Q(w) 是所有权重 w1,w2,…,wn 的函数。

偏导数 ∂wi∂Q 表示：固定其他所有权重不变时，权重 wi 变化一点点会导致损失 Q 变化多少。
这个值的正负告诉我们：增大 wi 会让损失变大还是变小；绝对值大小告诉我们影响的程度。
所有偏导数组成的向量，就是梯度 ∇Q(w)。

反向传播的本质：

就是用链式法则，逐层计算损失函数对每一个权重的偏导数，最终得到整个梯度向量。

4. 关键区别

普通导数	偏导数
单变量函数	多变量函数
符号：dxdy	符号：∂x∂z
描述一个变量的变化率	描述 “一个变量变化、其他固定” 时的变化率

🧠 示例：简单的两层神经网络

我们用一个非常直观的例子来拆解反向传播的每一步。

1. 网络结构

输入：x=2
隐藏层权重：w1=0.5，偏置：b1=0.1
激活函数：sigmoid σ(z)=1+e−z1
输出层权重：w2=0.3
真实标签：y=1

2. 前向传播（计算预测值与损失）

隐藏层输入：

z=w1⋅x+b1=0.5×2+0.1=1.1
隐藏层输出（激活后）：

a=σ(z)=1+e−1.11≈0.7503
最终预测值：

y^=w2⋅a=0.3×0.7503≈0.2251
损失函数（均方误差）：

Q=(y^−y)2=(0.2251−1)2≈0.6006

3. 反向传播（计算每个权重的偏导数）

我们的目标是求出 ∂w2∂Q 和 ∂w1∂Q，这就是损失对权重的偏导数。

步骤 1：计算损失对输出层权重 w2 的偏导数

∂w2∂Q=∂y^{∂Q⋅∂w2∂y}

∂y^∂Q=2(y−y)≈2(0.2251−1)=−1.5498
∂w2∂y^=a≈0.7503
所以：

∂w2∂Q≈−1.5498×0.7503≈−1.1628

步骤 2：计算损失对隐藏层权重 w1 的偏导数

这一步需要多层链式法则：

∂w1∂Q=∂y^{∂Q⋅∂a∂y}⋅∂z∂a⋅∂w1∂z

∂y^∂Q≈−1.5498（已算）
∂a∂y^=w2=0.3
∂z∂a=σ(z)(1−σ(z))≈0.7503×(1−0.7503)≈0.1873
∂w1∂z=x=2

代入计算：

∂w1∂Q≈−1.5498×0.3×0.1873×2≈−0.1764

4. 梯度与权重更新

现在我们得到了梯度向量：

∇Q=[∂w1∂Q,∂w2∂Q]≈[−0.1764,−1.1628]

假设学习率 η=0.1，用梯度下降公式更新权重：

w1new=w1−η⋅∂w1∂Q≈0.5−0.1×(−0.1764)=0.5176

w2new=w2−η⋅∂w2∂Q≈0.3−0.1×(−1.1628)=0.4163

嘿嘿，还是没看懂

查看全文

http://www.jsqmd.com/news/1026104/

2026年重庆次氯酸钠工业与消毒级水处理药剂，实力源头厂家深度评估 - 企业推荐官【官方】

自动门厂家怎么选？2026最新TOP榜解析 - 资讯快报

CAD图纸识别踩坑记：手动审了3天，AI跑了20分钟

ASP.NET MVC解决方案结构设计：从分层陷阱到业务垂直切片

从OpenSSH升级到兼容老旧系统：一次‘密钥交换失败’引发的SSH算法兼容性深度探讨

Mysql：实用工具：解密【.mylogin.cnf】的python小工具

Sagacity博客解析：技术写作的认知脚手架与可验证知识体系

PostgreSQL 技术日报 (6月16日)｜Neon 自动化再进一步，逻辑复制冲突日志迎来 v50 更新

2026 广州新房卫生间漏水找谁靠谱？收集 5 家本地正规防水企业业主真实评价 - 防水资讯

你的UDS 27服务测试卡在哪了？详解CANoe中CDD配置与DLL算法调用的那些坑

2026华东定制特种线缆TOP企业评测：核心选型维度与避坑指南 - 资讯快报

称重传感器选购注意事项：广东犸力在商业结算中零误差 - 品牌速递

2026 武汉梅雨季卫生间漏水频繁复发怎么办？对比 5 家本地专业防水公司 - 防水资讯

京东 E 卡回收流程完整攻略｜正规礼品卡回收平台推荐 + 避坑干货 - 资讯快报

2026 温州常年多雨卫生间泡水漏水维修？深度测评 5 家本地防水维修商家 - 防水资讯

DiskSpd终极指南：微软官方存储性能测试工具完整教程

初创公司数据栈五大陷阱：从工具泛滥到组织割裂

2026南昌高净值人群离婚财产纠纷解决方案：8位资深婚姻家事律师专业推荐 - 资讯快报

2026年6月最新天梭中国官方售后电话地址服务热线客服网点 - 资讯快报

终极虚幻引擎存档编辑指南：uesave如何让你轻松掌控游戏进度

2026武汉空调维修-中央空调维修加氟安装正规服务商推荐（全武汉可上门）-修乐家 - 资讯快报

QorIQ平台安全启动与NetPDL自定义协议开发实战指南

丽江目的地婚礼怎么预订？完整流程指南 - 资讯快报

泉州搬家物流需求痛点与选型指南 - 资讯快报

气候AI落地实战：小模型+物理约束+边缘部署

2026年国内论文辅导机构口碑实测汇总，硕博圈公认靠谱榜单 - 刚达R

2026年线上投票工具实测：5款平台对比，按需挑选更省心

okbiye 一站式毕业论文 AI 创作工具｜解决本科硕博论文撰写全流程痛点，高效完成规范高质毕业文稿