当前位置: 首页 > news >正文

为什么深度学习离不开矩阵计算?一篇看懂向量化与 Batch

为什么深度学习离不开矩阵计算?一篇看懂向量化与 Batch

视频来源:B站 @Ai学术叫叫兽
视频链接:https://www.bilibili.com/video/BV1VjKd6hEun/

很多同学学到这里都会问:

为什么深度学习到处都是矩阵?

答案很简单:

模型不是在算一个样本、一个神经元,而是在同时算大量样本、大量特征、大量神经元。矩阵计算就是把重复劳动打包,一次性交给高效底层库和 GPU。


01 核心公式

Z = W X + b
符号含义
X一个 batch 的输入样本
W一层网络的权重矩阵
b偏置,会沿 batch 维度广播
Z当前层输出

比如:

W(3×4) × X(4×5) = Z(3×5)

中间维度4对上,所以能乘;输出取外侧3×5


02 六个关键词

概念小白记法
向量一维数字列表
矩阵二维数字表
张量三维及以上数组
向量化用矩阵运算替代显式循环
并行计算大量相似运算同时执行
Shape 检查用维度规则判断计算能否成立

记住一句话:

看不懂模型时,先别看名字,先看 shape。


03 Batch 是什么?

Batch 不是改变模型含义,而是把多个样本并排计算。

如果一个样本是4×1,5 个样本并排就是:

X(4×5)

权重是:

W(3×4)

那么输出:

Z(3×5)

Z的每一列对应一个样本的输出。

04 为什么向量化更快?

显式 Python 循环是一小步一小步调度:

foriinrange(batch_size):forjinrange(num_neurons):...

向量化写法是:

Z=W @ X+b

底层会调用高效矩阵运算库,并利用硬件并行。

所以向量化不只是代码短,而是执行方式更适合深度学习。


05 课后自测

  1. W(3×4)X(4×5)能否相乘?
  2. 输出 shape 是什么?
  3. Batch 维度表示什么?
  4. 为什么 batch 不是越大越好?
  5. 遇到 shape 报错应该先查什么?

答案核心:

可以相乘,输出 3×5。 Batch 表示一次并排处理多少个样本。 先查输入、输出、中间变量和广播规则。

资料领取

第06讲 PPT、讲义、动画和 NumPy 代码练习可以无偿送给大家。

需要资料的同学,评论区或私信回复:

06向量化

后面继续更新深层神经网络、CNN、YOLO26 训练和部署。想系统补深度学习基础,记得关注。

http://www.jsqmd.com/news/1106592/

相关文章:

  • Linux多线程--cleanup push/pop
  • Java毕业设计-基于 Java 的医院医疗设备管理系统的设计与实现 基于 Java 的医院医疗器械资产管控系统(源码+LW+部署文档+全bao+远程调试+代码讲解等)
  • idea卡顿 idea设置了Maximum Heap Size 但current value还是小值
  • 基于全域场介质扰动的光传播机理新模型研究
  • Claude Code内置隐藏木马近3个月,官方回滚难消中国用户信任危机
  • 学生会议记录软件帮你记录更快更准整理更省心
  • 当AI写出百万行代码:金融科技的下一站是“可控智能”
  • 有哪些适合硕士、从开题至定稿的一体化 AI 写作工具推荐?
  • TLS Connect 如何解决了关于证书有效期缩短的问题?
  • 想要找性价比合适的亮片胶,这几家口碑过硬的生产厂家推荐给你
  • 【Python工程化实战】变异测试(Mutation Testing):mutmut 验证测试套件有效性
  • Java毕业设计-基于 Java Web 的茶园文化宣传交流平台的设计与实现 基于 Java Web 的茶园茶农文化交流平台的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等)
  • Metasploit实战指南:从工具使用到渗透测试思维框架构建
  • 可以出具软件测试报告的第三方软件测评机构推荐
  • 编程知识点讲解怎么录屏?程序员高质量技术教学录屏避坑指南
  • TEMPO GALIL CC903-61531运动接口模块
  • Yaskawa XU-ACP130-B11晶圆预对准器
  • Java计算机毕设之基于 Java 的在线学术文献收纳检索系统的设计与实现 基于 Java 的电子书目文献资源管理系统(完整前后端代码+说明文档+LW,调试定制等)
  • 【实战分享】.NET 10 + ABP WebAPI 项目发布部署至 Docker Desktop 避坑与实践记录
  • Java毕业设计-基于 SpringBoot 的宠物医院医疗设备与疫苗管理系统的设计与实现 基于 SpringBoot 的宠物医院综合管理系统(源码+LW+部署文档+全bao+远程调试+代码讲解等)
  • 基于ICM-42605和PIC18F87J11的6DOF运动追踪系统设计
  • 用 OpenCode 理解陌生代码库:3 个实用命令让你快速上手任何项目
  • Selenium反检测实战:让Chrome与Firefox浏览器绕过网站自动化识别
  • 数据中台建设中“平台优先“vs“治理优先“的技术路线之争
  • 嵌入式系统设计师重要100条知识点速记
  • 半导体硅片制造|纯技术专家线晋升 CTO 完整路径 薪资 关键领域
  • 如何完全掌握Cursor Pro破解工具:终极免费使用AI编程助手指南
  • 认知降维打击:为什么有钱的交易员反而更爱自营交易平台?
  • 浏览器指纹一致性怎么检查?IP、时区、语言和 Session 要分层看
  • 靠谱的基因检测企业有哪些