当前位置：首页 > news >正文

为什么深度学习离不开矩阵计算？一篇看懂向量化与 Batch

news 2026/7/2 4:17:48

为什么深度学习离不开矩阵计算？一篇看懂向量化与 Batch

视频来源：B站 @Ai学术叫叫兽
视频链接：https://www.bilibili.com/video/BV1VjKd6hEun/

很多同学学到这里都会问：

为什么深度学习到处都是矩阵？

答案很简单：

模型不是在算一个样本、一个神经元，而是在同时算大量样本、大量特征、大量神经元。矩阵计算就是把重复劳动打包，一次性交给高效底层库和 GPU。

01 核心公式

Z = W X + b

符号	含义
`X`	一个 batch 的输入样本
`W`	一层网络的权重矩阵
`b`	偏置，会沿 batch 维度广播
`Z`	当前层输出

比如：

W(3×4) × X(4×5) = Z(3×5)

中间维度4对上，所以能乘；输出取外侧3×5。

02 六个关键词

概念	小白记法
向量	一维数字列表
矩阵	二维数字表
张量	三维及以上数组
向量化	用矩阵运算替代显式循环
并行计算	大量相似运算同时执行
Shape 检查	用维度规则判断计算能否成立

记住一句话：

看不懂模型时，先别看名字，先看 shape。

03 Batch 是什么？

Batch 不是改变模型含义，而是把多个样本并排计算。

如果一个样本是4×1，5 个样本并排就是：

X(4×5)

权重是：

W(3×4)

那么输出：

Z(3×5)

Z的每一列对应一个样本的输出。

04 为什么向量化更快？

显式 Python 循环是一小步一小步调度：

foriinrange(batch_size):forjinrange(num_neurons):...

向量化写法是：

Z=W @ X+b

底层会调用高效矩阵运算库，并利用硬件并行。

所以向量化不只是代码短，而是执行方式更适合深度学习。

05 课后自测

W(3×4)和X(4×5)能否相乘？
输出 shape 是什么？
Batch 维度表示什么？
为什么 batch 不是越大越好？
遇到 shape 报错应该先查什么？

答案核心：

可以相乘，输出 3×5。 Batch 表示一次并排处理多少个样本。 先查输入、输出、中间变量和广播规则。

资料领取

第06讲 PPT、讲义、动画和 NumPy 代码练习可以无偿送给大家。

需要资料的同学，评论区或私信回复：

06向量化

后面继续更新深层神经网络、CNN、YOLO26 训练和部署。想系统补深度学习基础，记得关注。

查看全文

http://www.jsqmd.com/news/1106592/

Linux多线程--cleanup push/pop

Java毕业设计-基于 Java 的医院医疗设备管理系统的设计与实现基于 Java 的医院医疗器械资产管控系统(源码+LW+部署文档+全bao+远程调试+代码讲解等)

idea卡顿 idea设置了Maximum Heap Size 但current value还是小值

基于全域场介质扰动的光传播机理新模型研究

Claude Code内置隐藏木马近3个月，官方回滚难消中国用户信任危机

学生会议记录软件帮你记录更快更准整理更省心

当AI写出百万行代码：金融科技的下一站是“可控智能”

有哪些适合硕士、从开题至定稿的一体化 AI 写作工具推荐？

TLS Connect 如何解决了关于证书有效期缩短的问题？

想要找性价比合适的亮片胶，这几家口碑过硬的生产厂家推荐给你

【Python工程化实战】变异测试（Mutation Testing）：mutmut 验证测试套件有效性

Java毕业设计-基于 Java Web 的茶园文化宣传交流平台的设计与实现基于 Java Web 的茶园茶农文化交流平台的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等)

Metasploit实战指南：从工具使用到渗透测试思维框架构建

可以出具软件测试报告的第三方软件测评机构推荐

编程知识点讲解怎么录屏？程序员高质量技术教学录屏避坑指南

TEMPO GALIL CC903-61531运动接口模块

Yaskawa XU-ACP130-B11晶圆预对准器

Java计算机毕设之基于 Java 的在线学术文献收纳检索系统的设计与实现基于 Java 的电子书目文献资源管理系统(完整前后端代码+说明文档+LW，调试定制等）

【实战分享】.NET 10 + ABP WebAPI 项目发布部署至 Docker Desktop 避坑与实践记录

Java毕业设计-基于 SpringBoot 的宠物医院医疗设备与疫苗管理系统的设计与实现基于 SpringBoot 的宠物医院综合管理系统(源码+LW+部署文档+全bao+远程调试+代码讲解等)

基于ICM-42605和PIC18F87J11的6DOF运动追踪系统设计

用 OpenCode 理解陌生代码库：3 个实用命令让你快速上手任何项目

Selenium反检测实战：让Chrome与Firefox浏览器绕过网站自动化识别

数据中台建设中“平台优先“vs“治理优先“的技术路线之争

嵌入式系统设计师重要100条知识点速记

半导体硅片制造｜纯技术专家线晋升 CTO 完整路径薪资关键领域

如何完全掌握Cursor Pro破解工具：终极免费使用AI编程助手指南

认知降维打击：为什么有钱的交易员反而更爱自营交易平台？

浏览器指纹一致性怎么检查？IP、时区、语言和 Session 要分层看

靠谱的基因检测企业有哪些

为什么深度学习离不开矩阵计算？一篇看懂向量化与 Batch

01 核心公式

02 六个关键词

03 Batch 是什么？

04 为什么向量化更快？

05 课后自测

资料领取

相关文章：