当前位置: 首页 > news >正文

从 Excel 手算理解 MLP(多层感知机)的完整计算过程

本文基于配套 Excel 文件,对一个最基础的 MLP(Multi-Layer Perceptron,多层感知机)进行完整拆解,详细展示:

  • 前向传播(Forward Propagation)

  • 激活函数(Activation Function)

  • 输出层计算

  • Loss 计算

  • 梯度求导

  • 反向传播(BackPropagation)

  • 权重更新

  • Bias 更新

    的全部数学计算过程。


1. 什么是 MLP

MLP(多层感知机)是:

最基础的神经网络结构

它本质上由:

输入层 → 隐藏层 → 输出层

组成。

神经网络通过:

输入数据 → 计算预测结果 → 计算误差 → 更新参数

不断学习数据规律。


2. 本 Excel 的网络结构

本 Excel 使用的是:

单输入 + 单隐藏层 + 单输出

结构如下:

输入层(1) ↓ 隐藏层(6) ↓ 输出层(1)

即:

  • 输入层:1 个神经元

  • 隐藏层:6 个神经元

  • 输出层:1 个神经元


3. 初始参数说明

Excel 中黄色单元格为可修改参数。

主要参数如下:

参数符号含义
输入值$x$当前输入数据
隐藏层权重$W_h$输入层到隐藏层权重
隐藏层 Bias$b_h$隐藏层偏置
输出层权重$W_o$隐藏层到输出层权重
输出层 Bias$b_o$输出层偏置
学习率$\eta$参数更新速度
目标值$y_{target}$真实标签

4. 前向传播(Forward Propagation)

前向传播的目标:

输入数据 → 计算预测结果


5. Step 1:输入层到隐藏层

隐藏层中的每个神经元都会执行:

$$
z=xw+b
$$

其中:

  • x:输入值

  • w:权重

  • b:Bias

    Excel 中公式:

=$A$4*H4+C4

对应:

  • A4:输入值

  • H4:权重

  • C4:Bias


5.1 数值计算示例

假设:

x=5
w=10
b=10

则:

最终:z=60
这就是某个隐藏层神经元的输入值。


6. Step 2:激活函数(Activation Function)

神经网络不能只有线性计算。

否则:

多层网络 ≈ 单层线性模型

因此必须加入:

非线性激活函数

本 Excel 使用:

Leaky ReLU

公式:




6.1 Excel 公式

=IF(N4>0,N4,0.05*N4)

含义:

  • 大于 0:直接输出

  • 小于等于 0:保留 0.05 倍


6.2 为什么使用 Leaky ReLU

普通 ReLU:


存在:

神经元死亡问题

因为负数区域梯度为 0。

而 Leaky ReLU:

负数区域仍保留微小梯度

因此训练更加稳定。


7. Step 3:隐藏层输出

隐藏层 6 个神经元会分别输出:

这些值会继续传入输出层。


8. Step 4:输出层计算

输出层会继续进行:

加权求和

Excel 中:

=SUMPRODUCT(O4:O9,R4:R9)+R11

数学式:

其中:

  • :隐藏层输出

  • :输出层权重

  • :输出层 Bias


9. Step 5:输出层激活函数

输出层同样使用:

Leaky ReLU

Excel:

=IF(X4>0,X4,0.05*X4)

得到最终预测值:


10. Step 6:Loss(损失函数)

神经网络训练目标:

让预测值接近真实值

这里使用:

平方误差(MSE)

公式:

Excel:

=(Y4-Z4)^2

10.1 数值示例

假设:

则:

误差越大:
越大


11. 为什么需要反向传播

前向传播只能得到结果。

真正关键的是:

如何修改参数,让误差越来越小?

因此需要:

BackPropagation(BP)

核心流程:

Loss ↓ 求导 ↓ 得到梯度 ↓ 更新参数

12. Step 7:输出层梯度计算

Excel 中:

=2*(Y4-Z4)*IF(Y4>0,1,0.05)

本质:


13. Loss 求导

平方误差:

求导:


14. 激活函数求导

Leaky ReLU 导数:

因此 Excel 写成:

IF(Y4>0,1,0.05)

15. 链式法则(Chain Rule)

神经网络训练最核心的数学基础:

链式法则

公式:

含义:

Loss 对权重的影响 = 误差传播 × 激活函数梯度 × 当前层输入

这就是:

BP 算法的本质


16. Step 8:输出层权重更新

梯度下降公式:

其中:

  • :学习率

  • :梯度


16.1 Excel 公式

=T4*$B$1

表示:

梯度 × 学习率

然后:

=R4-U4

表示:

新权重 = 旧权重 - 更新量

17. Step 9:Bias 更新

Bias 本质也是参数。

因此:

更新方式与权重完全一致。


18. Step 10:误差传播回隐藏层

隐藏层没有直接接触真实值。

因此:

需要输出层误差:

反向传播

Excel:

=$AB$4*R4*IF(O4>0,1,0.05)

本质:

隐藏层梯度 = 输出层梯度 \times 输出层权重 \times 激活函数导数


19. 隐藏层权重更新

隐藏层参数同样遵循:


只不过:

隐藏层梯度需要通过:

输出层误差 → 链式法则 → 反向传播

得到。


20. 神经网络为什么能学习

整个训练过程实际上就是:

随机初始化参数 ↓ 进行预测 ↓ 计算误差 ↓ 求梯度 ↓ 更新参数 ↓ 误差减小 ↓ 重复很多次

最终:

模型参数逐渐逼近最优解。


21. MLP 的本质

其实可以把 MLP 理解成:

一个不断修正参数的函数逼近器

它通过:

误差 → 梯度 → 参数更新

不断优化预测结果。


22. 用一句话理解 BP 神经网络

可以简单理解为:

前向传播负责“算结果” 反向传播负责“改参数”

整个训练循环:

Forward → Loss → Backward → Update → Forward...

最终:
更小

http://www.jsqmd.com/news/861951/

相关文章:

  • 代码大模型训练的典型工程挑战解析
  • 学生用户画像-考勤主题标签构建
  • K8s Ingress Nginx 控制器配置 HTTPS 自动重定向的 YAML 要怎么写?
  • 2026年四川颗粒板厂家评测:靠谱供应商核心维度解析 - 优质品牌商家
  • 卷赢了!山东大学学者七库联合发文一区TOP(IF 10.6),解锁痴呆研究新赛道!
  • Mythos骨架式推理:企业级AI能力治理与因果建模新范式
  • C++静态成员与静态方法
  • 2026年q2天津闲置酒水回收正规机构实力盘点:天津名贵酒品回收回收/天津洋酒回收/天津礼盒酒水回收/优选推荐 - 优质品牌商家
  • Transformer架构优化与高效计算实践
  • C++强制类型转换的四种方式
  • 国内不发火水泥砂浆高性价比厂家实测排行权威盘点:环氧灌浆料/环氧砂浆/环氧胶泥/硅烷浸渍剂/硅烷膏体/优选指南 - 优质品牌商家
  • 【助睿实验指导】助睿ETL-订单利润分流数据加工
  • 台湾话TTS自然度卡在3.2/5?用MOS-LQO双维度测评法定位8类发音失真源(附自动化诊断脚本)
  • 预测性线索评分:用机器学习提升B2B销售转化率的实战指南
  • 警惕AI领域未经证实的技术传闻与虚构命名
  • 留学生遭遇大厂 PIP 晴天霹雳?2026 北美科技圈绩效提升计划深度解码与生存闭环
  • CAN模型:让GAN具备审美判断与风格突破能力
  • 智慧铁路之钢轨缺陷识别 自动化轨道检测系统开发 铁路养护车辆计算机视觉功能实现 轨道交通腐蚀识别 钢轨磨损识别10340期
  • LeetCode--112. 路径总和(二叉树)
  • 动态图神经网络实现多商品时序协同预测
  • 大模型技能训练:从模仿到自主进化
  • 千问 LeetCode 2532.过桥的时间 public int findCrossingTime(int n, int k, int[][] time)
  • 神经网络工程化:从信号处理视角解剖CNN/RNN/Transformer设计逻辑
  • 8051汇编DW指令字节序问题与解决方案
  • 用LLM嵌入向量破解工业微缺陷检测的长尾难题
  • 巴别鸟vs坚果云:企业云盘同步机制踩坑与实战配置
  • Lovable框架实战速成:3天掌握UI动效、状态管理与热重载调试全流程
  • AI周报如何成为技术决策的精准导航仪
  • AI算力增长的绿色悖论:硬件生产与模型训练的环境成本分析
  • Predictive Lead Scoring实战:B2B销售线索智能评分与CRM集成