当前位置: 首页 > news >正文

2深度学习基础知识

2深度学习基础知识

一、深度学习基础回顾

1. 传统机器学习 vs. 深度学习

维度传统机器学习深度学习
特征处理人工设计自动学习
模型复杂度浅层结构深层非线性架构
数据需求小规模有效大数据驱动
计算成本极高 (依赖GPU)
可解释性低 (黑盒模型)
适用领域结构化数据/简单模式非结构化数据 (图像、语音、文本)

2. 人工智能层次结构

  • 人工智能 (AI):具备人类智能水平的系统。
  • 机器学习 (ML):能够从数据中自动学习规则的算法。
  • 深度学习 (DL):使用多层神经网络的机器学习技术。
  • 大语言模型 (LLM):用于解析和生成类似人类语言文本的深度神经网络。

二、PyTorch 与 张量基础

1. PyTorch 框架特点

  • 前身是 Torch,使用 Python 重写。
  • 核心优势:灵活、支持动态计算图、支持 GPU 加速、环境优先。

2. 张量的维度

张量是一个多维数组,方向称为,阶数称为维数

  • 0-d (标量):一个类别(如1.0)。

  • 1-d (向量):一个特征向量(如[1.0, 2.7, 3.4])。

  • 2-d (矩阵):一个样本特征矩阵。

  • 3-d:RGB图片(宽×\times××\times×通道)。

  • 4-d:图片批量(批量大小×\times××\times××\times×通道)。

  • 5-d:视频批量(批量大小×\times×时间×\times××\times××\times×通道)。

3.访问数组中的元素

创建数组

访问数组中的元素

3. PyTorch 数据操作

  • 导入import torch(注意不是import pytorch)。
  • 创建
    • torch.arange(12):生成 0-11 的向量。
    • torch.zeros((2, 3, 4))/torch.ones((2, 3, 4)):全 0 或全 1。
    • torch.randn(3, 4):标准正态分布(均值 0,方差 1)。
    • torch.tensor([[...]]):通过 Python 列表显式创建。
  • 属性访问
    • x.shape:查看形状。
    • x.numel():查看元素总数。
    • x.reshape(3, 4):改变形状但不改变值和数量。
  • 连接
    • torch.cat((X, Y), dim=0):按行拼接。
    • torch.cat((X, Y), dim=1):按列拼接。

4. 广播机制—— 重点

​ 广播机制是PyTorch中的一种自动扩展张量形状的机制,使得两个不同形状的张量可以进行逐元素操作。当两个张量的形状不完全匹配时,PyTorch会自动将较小的张量**“广播”**到与较大张量相同的形状,以便进行逐元素操作。

  1. 从后向前比较形状:从张量的最后一个维度开始,向前逐个维度比较。
  2. 维度兼容:如果两个张量在某个维度上的大小相等,或者其中一个张量在该维度上的大小为1,则这两个张量在该维度上是兼容的。
  3. 扩展维度:如果两个张量在某个维度上不兼容,则PyTorch会自动将大小为1的维度扩展为与另一个张量相同的大小。
  4. 如果两个张量在任何维度上都不兼容(即大小既不相等,也不为1),则无法进行广播,PyTorch会抛出错误。



第三部分:数据预处理

1. 典型流程

  1. 读取数据:通常使用 Pandas 库pd.read_csv()
  2. 处理缺失值 (NaN)
    • 插值inputs.fillna(inputs.mean())用均值填充。
    • 删除:直接去掉含有缺失值的行或列。
  3. 类别值转换
    • 使用pd.get_dummies(inputs, dummy_na=True)将类别转为 One-hot 编码。
  4. 转为张量格式
    • torch.tensor(df.values)
    • 深度学习惯例:通常使用float32提高计算速度。

第四部分:线性代数与计算

1. 矩阵运算

  • 按元素运算+,-,*,/,**
  • 哈达玛积A * B,符号为⊙\odot,对应元素相乘。
  • 点积torch.dot(x, y),对应元素乘积之和。
  • 矩阵-向量积torch.mv(A, x)
  • 矩阵-矩阵乘法torch.mm(A, B),即线性代数中的矩阵乘法。
  • 转置A.T
  • 对称矩阵:满足A=ATA = A^TA=AT

2. 降维与非降维求和

  • X.sum():所有元素求和,变为标量。
  • X.sum(axis=0):沿行求和,消除第 0 维。
  • X.sum(axis=1, keepdims=True):保持轴数不变(利于后续广播)。
  • X.mean():平均值。
  • X.cumsum(axis=0):累积总和(不降维)。

3. 范数 —— 向量/矩阵的“长度”

  • L2L_2L2范数:元素平方和的平方根∥x∥2=∑xi2\|x\|_2 = \sqrt{\sum x_i^2}x2=xi2
  • L1L_1L1范数:元素绝对值之和∥x∥1=∑∣xi∣\|x\|_1 = \sum |x_i|x1=xi
  • 弗罗贝尼乌斯范数:矩阵元素平方和的平方根∥X∥F=∑∑xij2\|X\|_F = \sqrt{\sum \sum x_{ij}^2}XF=∑∑xij2

第五部分:微积分与自动微分

1. 导数与梯度

  • 梯度:将导数拓展到向量。对于y=f(x)y = f(\mathbf{x})y=f(x),梯度∇xy\nabla_{\mathbf{x}}yxy是一个包含所有偏导数的向量。
  • 链式法则dydx=dydududx\frac{dy}{dx} = \frac{dy}{du} \frac{du}{dx}dxdy=dudydxdu

2. 计算图

  • 深度学习将代码分解为操作子,并表示为有向无环图
  • 正向传播 (Forward):执行图计算,存储中间结果。
  • 反向传播 (Backward):从结果出发,逆向执行图以计算梯度。

3. PyTorch 自动求导步骤

  1. 设置属性:x = torch.tensor([...], requires_grad=True)
  2. 定义函数:y = f(x)
  3. 反向传播:y.backward()
  4. 获取梯度:x.grad

第六部分:线性神经网络

1. 回归vs. 分类

  • 回归:输出连续变量(如房价预测、身高预测)。
  • 分类:输出离散变量/概率分布(如图像分类、文本分类)。

2. 线性回归模型

  • 假设:自变量与因变量存在线性关系y=wTx+by = \mathbf{w}^T\mathbf{x} + by=wTx+b
  • 噪声假设:假设噪声遵循正态分布。
  • 模型组成
    • 权重 (Weights)w1,w2,…w_1, w_2, \dotsw1,w2,
    • 偏差 (Bias)bbb

3. 损失函数

用于量化实际值yyy与预测值y^\hat{y}y^之间的差距。

  • 平方损失

    l(y,y^)=12(y−y^)2l(y, \hat{y}) = \frac{1}{2}(y - \hat{y})^2l(y,y^)=21(yy^)2

  • 训练目标:在整个训练集上最小化损失均值。

http://www.jsqmd.com/news/371482/

相关文章:

  • 独居餐如何有仪式感?天然提鲜调味品,让一人食告别凑活 - 谈谈-新视野
  • 信息论与编码篇---微分熵的极值性
  • 一人食不将就:轻盐调味让独居餐吃出健康与仪式感 - 谈谈-新视野
  • 自定义控件 - 流式布局:TagFlowLayout
  • 信息论与编码篇---连续随机变量的微分熵
  • 六个月慢酿的轻盐调味品,适配一人食的健康选择 - 谈谈-新视野
  • 一人食调味不将就:轻盐慢酿方案,让独居餐有仪式感还不浪费 - 谈谈-新视野
  • 破局基层沟通壁垒 赋能凉山脱贫攻坚——智能会议系统筑牢政务协同“数字桥梁”
  • Spring Boot 中采用 @Transactional 注解设置事务管理
  • 关于春节期间创作者身份认证审核延迟的通知
  • C/C++ 从 Excel (.xls)文件中提取图像 - capp
  • Flink从入门到上天系列第三篇:Flink集群化部署
  • B3929 [GESP202312 五级] 小杨的幸运数
  • Kafka从入门到上天系列第八篇:如果直接在zookeeper当中把controller节点直接删除掉。会发生什么?
  • AppML 案例模型:深度解析与应用前景
  • C# 类型转换详解:隐式、显式转换及常用方法
  • Node.js 安装配置指南
  • 智能教育Agentic AI的伦理框架:提示工程架构师的设计原则与实践
  • 按键消抖方法
  • MySQL 安装配置
  • 手把手教你学Simulink--基于高比例可再生能源渗透的复杂电网建模场景实例:多馈入直流系统中光伏电站与风电场协同运行仿真
  • 从模型到产品:Claude AI原生应用商业化路径
  • 使用 MATLAB/Simulink + Simscape Electrical 构建一个包含风光互补发电系统的模型
  • 数据库系统概论第一章
  • 1169: PIPI倒水
  • 数据库系统概论第二章关系数据库
  • AI原生应用里自然语言处理的核心算法解析
  • 数据库系统概论第三章关系数据库标准语言SQL
  • Eureka在大数据领域的核心作用揭秘
  • 突破查重难关!7大AI降重方案解析