当前位置：首页 > news >正文

深度学习入门

news 2026/7/11 2:07:27

文章目录

- 一、什么是深度学习？
- 二、神经网络基础
- - 1. 神经元与权重
  - 2. 激活函数
- 三、从感知器到多层感知器
- - 1. 感知器（Perceptron）
  - 2. 多层感知器（MLP）
- 四、神经网络的训练方法
- - 1. 损失函数
  - 2. 梯度下降
  - 3. 反向传播（Backpropagation，BP）
- 五、正则化与优化
- - 1. 正则化惩罚
  - 2. 学习率与初始化

一、什么是深度学习？

深度学习（Deep Learning，DL）是机器学习（Machine Learning，ML）领域中的一个重要分支，它基于人工神经网络的结构，模拟人脑处理信息的方式，通过多层次的数据表征和学习机制，实现对复杂数据的高效建模与识别。深度学习在图像识别、语音处理、自然语言理解等领域表现卓越，已成为推动人工智能发展的核心力量。

二、神经网络基础

1. 神经元与权重

神经网络由大量相互连接的“神经元”组成。每个神经元接收来自其他神经元的输入信号，这些信号在传递过程中会乘以一个权重，表示该连接的重要性。

输入信号： x 1 , x 2 , … , x n \text{输入信号}：x_1, x_2, \dots, x_n输入信号：x1,x2,…,xn
权重： w 1 , w 2 , … , w n \text{权重}：w_1, w_2, \dots, w_n权重：w1,w2,…,wn
加权和： z = w 1 x 1 + w 2 x 2 + ⋯ + w n x n + b \text{加权和}：z = w_1x_1 + w_2x_2 + \dots + w_nx_n + b加权和：z=w1x1+w2x2+⋯+wnxn+b
其中b bb为偏置项。

2. 激活函数

为了引入非线性能力，神经网络在加权和后会通过一个激活函数，如 Sigmoid、ReLU 等：

σ ( z ) = 1 1 + e − z \sigma(z) = \frac{1}{1 + e^{-z}}σ(z)=1+e−z1

三、从感知器到多层感知器

1. 感知器（Perceptron）

感知器是最简单的神经网络结构，仅包含输入层和输出层，可用于线性分类问题。其计算过程可表示为矩阵运算：

g ( W ⋅ x ) = z g(W \cdot x) = zg(W⋅x)=z

2. 多层感知器（MLP）

通过引入隐藏层，多层感知器能够处理非线性分类问题。隐藏层的神经元数量通常根据经验设定，可通过试验选择最佳结构。

关键点：
输入层节点数 = 特征维度
输出层节点数 = 目标维度
隐藏层节点数需通过实验调优

四、神经网络的训练方法

1. 损失函数

训练的目标是最小化预测值与真实值之间的误差，常用损失函数包括：

均方误差（MSE）
交叉熵损失（Cross-Entropy）
合页损失（Hinge Loss）

2. 梯度下降

通过计算损失函数对权重的偏导数（梯度），沿梯度反方向更新权重，逐步逼近最优解：

w new = w old − η ⋅ ∂ L ∂ w w_{\text{new}} = w_{\text{old}} - \eta \cdot \frac{\partial L}{\partial w}wnew=wold−η⋅∂w∂L
其中η \etaη为学习率。

3. 反向传播（Backpropagation，BP）

反向传播是训练深度网络的核心算法：

前向传播计算输出
计算损失值
反向传播误差，逐层更新权重
重复迭代直至收敛

五、正则化与优化

1. 正则化惩罚

为防止过拟合，常对权重施加正则化约束：

L1正则化：∑ ∣ w i ∣ \sum |w_i|∑∣wi∣
L2正则化：∑ w i 2 \sum w_i^2∑wi2

2. 学习率与初始化

学习率过大易震荡，过小则收敛慢
权重初始值常采用随机初始化，避免对称性

http://www.jsqmd.com/news/130899/

相关文章：

FPGA教程系列-Vivado AXI4-Lite slave 测试

线性拟合模型

高反光条码读取技术突破：京元智能DPM PDA偏振光源与多光谱引擎解析

每日 AI 评测速递来啦（12.23）

最小重量机器设计问题的回溯法分析

2025德国留学机构综合实力榜单 - 栗子测评

2025.12.23总结

看着Uniswap的曲线，你想过自己做Swap吗？

【轴承故障诊断】带频率稀疏学习的轴承故障诊断【含Matlab源码 14763期】

新手买钓鱼竿怎么选？2025年鱼竿新手入门推荐TOP榜品牌解析 - 品牌2026

鸿蒙学习实战之路-弹性布局 Flex 全攻略

补充——CSS伪元素选择器，继承，优先级以及字体样式

一条SQL直接跑崩288核，1.5T内存数据库

TypeScript 与后端开发Node.js - 实践

大一新手不知道做什么？一个Arduino 闪烁LED红绿灯震惊全班同学！

当中断绑核遇上大模型推理：HostBound 问题优化全解析（昇腾深度实战版）

2025uv喷码机厂家推荐/uv喷码机排名 - 栗子测评

121. 买卖股票的最佳时机

考研初试落幕，前方星光依旧！大学生考研初试后超全攻略

Axelspace与Exolaunch签署多批次发射安排协议并计划发射新卫星

鱼竿排名第一名到第十名推荐：十大钓鱼竿品牌排行榜，国产十大鱼竿排名盘点 - 品牌2026

职场笔杆子必看！2025公文写作软件TOP3对比

给自己做一个 ChatGPT：基于 Gradio 的本地 LLM 网页对话界面

【鸿蒙开发者跨平台开发可选工具】Windows 11 安装 Android Studio 完整指南

Axelspace：与Pale Blue, Inc.签署在轨演示服务合同的公告

面试官：大模型对齐中的 RLHF 与 DPO有什么本质区别？为何 DPO 能替代 RLHF？

XGBoost-机器学习【笔记向，持续加工中】

鸿蒙学习实战之路-相对布局 RelativeContainer 全攻略

易路iBuilder: 独立业务智能体平台，企业无需更换系统，快速构建AI就绪型组织