当前位置：首页 > news >正文

从 Excel 手算理解 MLP（多层感知机）的完整计算过程

news 2026/7/22 7:31:42

本文基于配套 Excel 文件，对一个最基础的 MLP（Multi-Layer Perceptron，多层感知机）进行完整拆解，详细展示：

前向传播（Forward Propagation）
激活函数（Activation Function）
输出层计算
Loss 计算
梯度求导
反向传播（BackPropagation）
权重更新
Bias 更新
的全部数学计算过程。

1. 什么是 MLP

MLP（多层感知机）是：

最基础的神经网络结构

它本质上由：

输入层 → 隐藏层 → 输出层

组成。

神经网络通过：

输入数据 → 计算预测结果 → 计算误差 → 更新参数

不断学习数据规律。

2. 本 Excel 的网络结构

本 Excel 使用的是：

单输入 + 单隐藏层 + 单输出

结构如下：

输入层(1) ↓ 隐藏层(6) ↓ 输出层(1)

即：

输入层：1 个神经元
隐藏层：6 个神经元
输出层：1 个神经元

3. 初始参数说明

Excel 中黄色单元格为可修改参数。

主要参数如下：

参数	符号	含义
输入值	$x$	当前输入数据
隐藏层权重	$W_h$	输入层到隐藏层权重
隐藏层 Bias	$b_h$	隐藏层偏置
输出层权重	$W_o$	隐藏层到输出层权重
输出层 Bias	$b_o$	输出层偏置
学习率	$\eta$	参数更新速度
目标值	$y_{target}$	真实标签

4. 前向传播（Forward Propagation）

前向传播的目标：

输入数据 → 计算预测结果

5. Step 1：输入层到隐藏层

隐藏层中的每个神经元都会执行：

$$
z=xw+b
$$

其中：

x：输入值
w：权重
b：Bias
Excel 中公式：

=$A$4*H4+C4

对应：

A4：输入值
H4：权重
C4：Bias

5.1 数值计算示例

假设：

x=5
w=10
b=10

则：

最终：z=60
这就是某个隐藏层神经元的输入值。

6. Step 2：激活函数（Activation Function）

神经网络不能只有线性计算。

否则：

多层网络 ≈ 单层线性模型

因此必须加入：

非线性激活函数

本 Excel 使用：

Leaky ReLU

公式：

6.1 Excel 公式

=IF(N4>0,N4,0.05*N4)

含义：

大于 0：直接输出
小于等于 0：保留 0.05 倍

6.2 为什么使用 Leaky ReLU

普通 ReLU：

存在：

神经元死亡问题

因为负数区域梯度为 0。

而 Leaky ReLU：

负数区域仍保留微小梯度

因此训练更加稳定。

7. Step 3：隐藏层输出

隐藏层 6 个神经元会分别输出：

这些值会继续传入输出层。

8. Step 4：输出层计算

输出层会继续进行：

加权求和

Excel 中：

=SUMPRODUCT(O4:O9,R4:R9)+R11

数学式：

其中：

：隐藏层输出
：输出层权重
：输出层 Bias

9. Step 5：输出层激活函数

输出层同样使用：

Leaky ReLU

Excel：

=IF(X4>0,X4,0.05*X4)

得到最终预测值：

10. Step 6：Loss（损失函数）

神经网络训练目标：

让预测值接近真实值

这里使用：

平方误差（MSE）

公式：

Excel：

=(Y4-Z4)^2

10.1 数值示例

假设：

则：

误差越大：
越大

11. 为什么需要反向传播

前向传播只能得到结果。

真正关键的是：

如何修改参数，让误差越来越小？

因此需要：

BackPropagation（BP）

核心流程：

Loss ↓ 求导 ↓ 得到梯度 ↓ 更新参数

12. Step 7：输出层梯度计算

Excel 中：

=2*(Y4-Z4)*IF(Y4>0,1,0.05)

本质：

13. Loss 求导

平方误差：

求导：

14. 激活函数求导

Leaky ReLU 导数：

因此 Excel 写成：

IF(Y4>0,1,0.05)

15. 链式法则（Chain Rule）

神经网络训练最核心的数学基础：

链式法则

公式：

含义：

Loss 对权重的影响 = 误差传播 × 激活函数梯度 × 当前层输入

这就是：

BP 算法的本质

16. Step 8：输出层权重更新

梯度下降公式：

其中：

：学习率
：梯度

16.1 Excel 公式

=T4*$B$1

表示：

梯度 × 学习率

然后：

=R4-U4

表示：

新权重 = 旧权重 - 更新量

17. Step 9：Bias 更新

Bias 本质也是参数。

因此：

更新方式与权重完全一致。

18. Step 10：误差传播回隐藏层

隐藏层没有直接接触真实值。

因此：

需要输出层误差：

反向传播

Excel：

=$AB$4*R4*IF(O4>0,1,0.05)

本质：

隐藏层梯度 = 输出层梯度 \times 输出层权重 \times 激活函数导数

19. 隐藏层权重更新

隐藏层参数同样遵循：

只不过：

隐藏层梯度需要通过：

输出层误差 → 链式法则 → 反向传播

得到。

20. 神经网络为什么能学习

整个训练过程实际上就是：

随机初始化参数 ↓ 进行预测 ↓ 计算误差 ↓ 求梯度 ↓ 更新参数 ↓ 误差减小 ↓ 重复很多次

最终：

模型参数逐渐逼近最优解。

21. MLP 的本质

其实可以把 MLP 理解成：

一个不断修正参数的函数逼近器

它通过：

误差 → 梯度 → 参数更新

不断优化预测结果。

22. 用一句话理解 BP 神经网络

可以简单理解为：

前向传播负责“算结果” 反向传播负责“改参数”

整个训练循环：

Forward → Loss → Backward → Update → Forward...

最终：
更小

查看全文

http://www.jsqmd.com/news/861951/

代码大模型训练的典型工程挑战解析

学生用户画像-考勤主题标签构建

K8s Ingress Nginx 控制器配置 HTTPS 自动重定向的 YAML 要怎么写？

2026年四川颗粒板厂家评测：靠谱供应商核心维度解析 - 优质品牌商家

卷赢了！山东大学学者七库联合发文一区TOP（IF 10.6），解锁痴呆研究新赛道！

Mythos骨架式推理：企业级AI能力治理与因果建模新范式

C++静态成员与静态方法

2026年q2天津闲置酒水回收正规机构实力盘点：天津名贵酒品回收回收/天津洋酒回收/天津礼盒酒水回收/优选推荐 - 优质品牌商家

Transformer架构优化与高效计算实践

C++强制类型转换的四种方式

【助睿实验指导】助睿ETL-订单利润分流数据加工

台湾话TTS自然度卡在3.2/5？用MOS-LQO双维度测评法定位8类发音失真源（附自动化诊断脚本）

预测性线索评分：用机器学习提升B2B销售转化率的实战指南

警惕AI领域未经证实的技术传闻与虚构命名

留学生遭遇大厂 PIP 晴天霹雳？2026 北美科技圈绩效提升计划深度解码与生存闭环

CAN模型：让GAN具备审美判断与风格突破能力

智慧铁路之钢轨缺陷识别自动化轨道检测系统开发铁路养护车辆计算机视觉功能实现轨道交通腐蚀识别钢轨磨损识别10340期

LeetCode--112. 路径总和（二叉树）

动态图神经网络实现多商品时序协同预测

大模型技能训练：从模仿到自主进化

千问 LeetCode 2532.过桥的时间 public int findCrossingTime(int n, int k, int[][] time)

神经网络工程化：从信号处理视角解剖CNN/RNN/Transformer设计逻辑

8051汇编DW指令字节序问题与解决方案

用LLM嵌入向量破解工业微缺陷检测的长尾难题

巴别鸟vs坚果云：企业云盘同步机制踩坑与实战配置

Lovable框架实战速成：3天掌握UI动效、状态管理与热重载调试全流程

AI周报如何成为技术决策的精准导航仪

AI算力增长的绿色悖论：硬件生产与模型训练的环境成本分析

Predictive Lead Scoring实战：B2B销售线索智能评分与CRM集成

本文基于配套 Excel 文件，对一个最基础的 MLP（Multi-Layer Perceptron，多层感知机）进行完整拆解，详细展示：

1. 什么是 MLP

最基础的神经网络结构

2. 本 Excel 的网络结构

单输入 + 单隐藏层 + 单输出

3. 初始参数说明

4. 前向传播（Forward Propagation）

5. Step 1：输入层到隐藏层

5.1 数值计算示例

6. Step 2：激活函数（Activation Function）

非线性激活函数

Leaky ReLU

6.1 Excel 公式

6.2 为什么使用 Leaky ReLU

神经元死亡问题

7. Step 3：隐藏层输出

8. Step 4：输出层计算

加权求和

9. Step 5：输出层激活函数

Leaky ReLU

10. Step 6：Loss（损失函数）

平方误差（MSE）

10.1 数值示例

11. 为什么需要反向传播

BackPropagation（BP）

12. Step 7：输出层梯度计算

13. Loss 求导

14. 激活函数求导

15. 链式法则（Chain Rule）

链式法则

BP 算法的本质

16. Step 8：输出层权重更新

16.1 Excel 公式

17. Step 9：Bias 更新

18. Step 10：误差传播回隐藏层

反向传播

19. 隐藏层权重更新

20. 神经网络为什么能学习

21. MLP 的本质

一个不断修正参数的函数逼近器

22. 用一句话理解 BP 神经网络

相关文章：