当前位置: 首页 > news >正文

深入解析:深度学习_三层神经网络传播案例(L0->L1->L2)

三层神经网络传播案例(L0→L1→L2L_0 \to L_1 \to L_2L0L1L2

为了简化计算,我们将网络简化为:输入层 (2个神经元) → 隐藏层 1 (2个神经元) → 输出层 (1个神经元)

约定:

  • 激活函数:Sigmoid (σ(z)=11+e−z\sigma(z) = \frac{1}{1+e^{-z}}σ(z)=1+ez1),其导数 σ′(z)=σ(z)(1−σ(z))\sigma'(z) = \sigma(z)(1-\sigma(z))σ(z)=σ(z)(1σ(z))
  • 损失函数:均方误差 (MSE):C=12(y^−y)2C = \frac{1}{2}(\hat{y} - y)^2C=21(y^y)2
  • 学习率 η\etaη:0.10.10.1

初始参数和输入值:

参数
输入 xxx (即 a(0)a^{(0)}a(0))[0.05,0.10][0.05, 0.10][0.05,0.10]
真实标签 yyy[0.01][0.01][0.01]
L0→L1L_0 \to L_1L0L1 权重 W(1)W^{(1)}W(1)(0.150.200.250.30)\begin{pmatrix} 0.15 & 0.20 \\ 0.25 & 0.30 \end{pmatrix}(0.150.250.200.30)
L1L_1L1 偏置 b(1)b^{(1)}b(1)[0.35,0.35][0.35, 0.35][0.35,0.35]
L1→L2L_1 \to L_2L1L2 权重 W(2)W^{(2)}W(2)(0.400.45)\begin{pmatrix} 0.40 \\ 0.45 \end{pmatrix}(0.400.45) (转置后为 1×21 \times 21×2)
L2L_2L2 偏置 b(2)b^{(2)}b(2)[0.60][0.60][0.60]

阶段一:前向传播 (Forward Pass)

1. 从 L0L_0L0L1L_1L1 (隐藏层)

  • 计算 L1L_1L1 的加权输入 z(1)z^{(1)}z(1)
    z1(1)=w11(1)x1+w21(1)x2+b1(1)=(0.15)(0.05)+(0.25)(0.10)+0.35=0.0075+0.025+0.35=0.3825\begin{split} z^{(1)}_1 &= w^{(1)}_{11}x_1 + w^{(1)}_{21}x_2 + b^{(1)}_1 \\ &= (0.15)(0.05) + (0.25)(0.10) + 0.35 \\ &= 0.0075 + 0.025 + 0.35 = \mathbf{0.3825} \end{split}z1(1)=w11(1)x1+w21(1)x2+b1(1)=(0.15)(0.05)+(0.25)(0.10)+0.35=0.0075+0.025+0.35=0.3825
    z2(1)=w12(1)x1+w22(1)x2+b2(1)=(0.20)(0.05)+(0.30)(0.10)+0.35=0.01+0.03+0.35=0.39\begin{split} z^{(1)}_2 &= w^{(1)}_{12}x_1 + w^{(1)}_{22}x_2 + b^{(1)}_2 \\ &= (0.20)(0.05) + (0.30)(0.10) + 0.35 \\ &= 0.01 + 0.03 + 0.35 = \mathbf{0.39} \end{split}z2(1)=w12(1)x1+w22(1)x2+b2(1)=(0.20)(0.05)+(0.30)(0.10)+0.35=0.01+0.03+0.35=0.39

  • 计算 L1L_1L1 的激活输出 a(1)a^{(1)}a(1)
    a1(1)=σ(0.3825)≈0.594(运用 11+e−0.3825)a^{(1)}_1 = \sigma(0.3825) \approx \mathbf{0.594} \quad (\text{使用 } \frac{1}{1+e^{-0.3825}})a1(1)=σ(0.3825)0.594(使用1+e0.38251)
    a2(1)=σ(0.39)≈0.596(使用 11+e−0.39)a^{(1)}_2 = \sigma(0.39) \approx \mathbf{0.596} \quad (\text{使用 } \frac{1}{1+e^{-0.39}})a2(1)=σ(0.39)0.596(使用1+e0.391)

2. 从 L1L_1L1L2L_2L2 (输出层)

3. 计算总损失CCC

  • 均方误差损失:
    C=12(y^−y)2=12(0.751−0.01)2C = \frac{1}{2}(\hat{y} - y)^2 = \frac{1}{2}(0.751 - 0.01)^2C=21(y^y)2=21(0.7510.01)2
    C=12(0.741)2≈0.2745C = \frac{1}{2}(0.741)^2 \approx \mathbf{0.2745}C=21(0.741)20.2745

阶段二:反向传播 (Backward Pass)

1. 计算输出层L2L_2L2 的误差项 δ(2)\delta^{(2)}δ(2)

δ(2)=∂C∂a(2)⊙σ′(z(2))\delta^{(2)} = \frac{\partial C}{\partial a^{(2)}} \odot \sigma'(z^{(2)})δ(2)=a(2)Cσ(z(2))

  • 损失对输出的导数∂C∂a(2)\frac{\partial C}{\partial a^{(2)}}a(2)Cy^−y=0.751−0.01=0.741\hat{y} - y = 0.751 - 0.01 = 0.741y^y=0.7510.01=0.741
  • Sigmoid 导数σ′(z(2))\sigma'(z^{(2)})σ(z(2))y^(1−y^)=0.751(1−0.751)≈0.187\hat{y}(1-\hat{y}) = 0.751(1-0.751) \approx 0.187y^(1y^)=0.751(10.751)0.187
  • 误差项 δ(2)\delta^{(2)}δ(2)
    δ(2)=0.741×0.187≈0.1384\delta^{(2)} = 0.741 \times 0.187 \approx \mathbf{0.1384}δ(2)=0.741×0.1870.1384

2. 计算 L2L_2L2的梯度并更新W(2),b(2)W^{(2)}, b^{(2)}W(2),b(2)

3. 计算隐藏层L1L_1L1 的误差项 δ(1)\delta^{(1)}δ(1)

δ(1)=((W(2))Tδ(2))⊙σ′(z(1))\delta^{(1)} = \left( (W^{(2)})^T \delta^{(2)} \right) \odot \sigma'(z^{(1)})δ(1)=((W(2))Tδ(2))σ(z(1))

  • 传播误差 EpropE_{\text{prop}}Eprop(使用旧权重W(2)W^{(2)}W(2))
    Eprop,1=w11(2)δ(2)=0.40×0.1384≈0.05536E_{\text{prop}, 1} = w^{(2)}_{11} \delta^{(2)} = 0.40 \times 0.1384 \approx 0.05536Eprop,1=w11(2)δ(2)=0.40×0.13840.05536
    Eprop,2=w21(2)δ(2)=0.45×0.1384≈0.06228E_{\text{prop}, 2} = w^{(2)}_{21} \delta^{(2)} = 0.45 \times 0.1384 \approx 0.06228Eprop,2=w21(2)δ(2)=0.45×0.13840.06228

  • Sigmoid 导数σ′(z(1))\sigma'(z^{(1)})σ(z(1))
    σ′(z1(1))=a1(1)(1−a1(1))=0.594(1−0.594)≈0.2414\sigma'(z^{(1)}_1) = a^{(1)}_1(1-a^{(1)}_1) = 0.594(1-0.594) \approx 0.2414σ(z1(1))=a1(1)(1a1(1))=0.594(10.594)0.2414
    σ′(z2(1))=a2(1)(1−a2(1))=0.596(1−0.596)≈0.2416\sigma'(z^{(1)}_2) = a^{(1)}_2(1-a^{(1)}_2) = 0.596(1-0.596) \approx 0.2416σ(z2(1))=a2(1)(1a2(1))=0.596(10.596)0.2416

  • 误差项 δ(1)\delta^{(1)}δ(1)
    δ1(1)=Eprop,1×0.2414=0.05536×0.2414≈0.01338\delta^{(1)}_1 = E_{\text{prop}, 1} \times 0.2414 = 0.05536 \times 0.2414 \approx \mathbf{0.01338}δ1(1)=Eprop,1×0.2414=0.05536×0.24140.01338
    δ2(1)=Eprop,2×0.2416=0.06228×0.2416≈0.01503\delta^{(1)}_2 = E_{\text{prop}, 2} \times 0.2416 = 0.06228 \times 0.2416 \approx \mathbf{0.01503}δ2(1)=Eprop,2×0.2416=0.06228×0.24160.01503

4. 计算 L1L_1L1的梯度并更新W(1),b(1)W^{(1)}, b^{(1)}W(1),b(1)

总结

经过一个完整的训练周期(前向传播和反向传播),所有的权重WWW 和偏置 bbb都向着降低总损失CCC的方向进行了微小的更新。在下一次迭代中,网络将使用这些新的参数进行计算,理论上会得到一个更接近0.010.010.01 的输出 y^\hat{y}y^
请添加图片描述

http://www.jsqmd.com/news/68344/

相关文章:

  • Excel炒股法:哪些个股值得波段操作
  • 2025 年江苏办公家具品牌排行榜:企业采购权威选购指南
  • Java开发者如何高效生成复杂SQL?飞算JavaAI的SQLChat为什么更可靠
  • 禅道文档 300 条用例一键生成:一次看懂爱测智能化测试平台的实力
  • 2025年度小酥肉淀粉/豆粉(食用混合淀粉)厂家TOP5推荐
  • 2025 年 12 月滤芯厂家权威推荐榜:塑料/铜/不锈钢/PVFM/烧结/微孔/真空/异型滤芯及消音器滤芯全品类深度解析
  • 2025北京室内家装设计服务TOP5权威推荐:甄选企业破解装
  • 2025口碑不错的网站建设专业公司TOP5推荐:知名企业甄选
  • 2025楼道座椅电梯品牌TOP5权威推荐:口碑厂家与价格参考
  • 2025年中国五大生物基氨基酸衍生物工厂推荐:看哪家实力强
  • 2025年上海全屋定制厂推荐:口碑好的电竞房全屋定制品牌企业
  • 2025年上海十大全屋定制公司推荐:不错的全屋定制酒柜公司推
  • 禅道---初步了解
  • 2025年萧山优秀的GEO源头厂家排行榜单,短视频矩阵/GEO服务/节目内容策划制作/GEO优化AI工具排名GEO企业怎么选择
  • 2025 年 12 月铝外壳加工厂家权威推荐榜:压铸铝外壳/LED铝外壳/充电宝铝外壳/电源铝外壳/精密铝外壳加工,匠心工艺与定制方案深度解析
  • 2025年靠谱的一字铰链TOP品牌厂家排行榜
  • 2025 年 12 月宁波网站建设服务商权威推荐榜:网站搭建、推广、定制与外贸独立站,专业设计与营销优化口碑之选
  • 2025年12月油性UV树脂,3D打印UV树脂,甲油胶UV树脂厂家权威推荐,技术实力与市场口碑深度解析​
  • 基于PCA的轴承故障诊断MATLAB程序实现
  • 2025年比较好的彩色橡塑保温管/铝箔橡塑保温板行业内知名厂家排行榜
  • 深入浅出 RANSAC 算法:理论剖析与实践演练
  • 2025年聚氨酯隔音垫订做厂家权威推荐榜单:聚氨酯减震橡胶垫块/聚氨酯垫块/聚氨酯垫片源头厂家精选
  • 现金流量与资金时间价值(笔记)
  • Atoll:让MacBook刘海屏变身智能交互中心
  • 2025 年 12 月粤港澳大湾区专精特新申报权威推荐榜:广州/深圳/惠州资质申请与补贴政策深度解析,实力服务机构精准导航
  • 2025年知名的别墅奢适美学五金/奢适美学五金优质厂家推荐榜单
  • 2025年12月办公家具,银行家具,实木办公家具厂家权威推荐,技术实力与市场口碑深度解析​
  • 动力刀座轴承厂家权威推荐 数控机床轴承/加工中心轴承/精密主轴轴承/磨床轴承/铣床主轴轴承
  • 意义行为原生:一种应对AI时代价值困境的新哲学基础
  • 2025年知名的快捷酒店家具加工厂