当前位置：首页 > news >正文

Tensor 是什么？PyTorch 里最重要的对象讲清楚

news 2026/7/1 1:38:05

学 PyTorch 时，第一个绕不开的概念就是Tensor。

很多人会把它翻译成“张量”，这个词听起来有点硬。但从代码角度看，可以先把 Tensor 理解成更通用的数组。

它可以是一组数字，也可以是一张表，还可以是一批图片。

从数字到 Tensor

一个普通数字可以看成 0 维 Tensor：

import torch  x = torch.tensor(3.0)

一组数字可以看成 1 维 Tensor：

x = torch.tensor([1.0, 2.0, 3.0])

一个矩阵可以看成 2 维 Tensor：

x = torch.tensor([ [1.0, 2.0], [3.0, 4.0], ])

如果是一批图片，维度可能更多，比如：

[batch, channel, height, width]

这就是深度学习里常见的四维 Tensor。

Tensor 为什么重要

在 PyTorch 里，几乎所有东西都会变成 Tensor。

训练数据是 Tensor，模型参数是 Tensor，中间计算结果是 Tensor，梯度也是 Tensor。

如果你理解了 Tensor 的形状和流动方式，很多模型代码就会清楚很多。

shape 是第一重点

看 Tensor 时，最重要的是看它的shape。

比如：

x = torch.randn(32, 784) print(x.shape)

这里的32通常表示 batch size，784可能表示每个样本的特征数量。

很多 PyTorch 报错，本质上都是 shape 对不上。

比如 Linear 层期待输入是[batch, in_features]，但你传进去的是别的形状，就会报维度错误。

Tensor 和 NumPy 有点像

如果你学过 NumPy，会发现 Tensor 和ndarray很像。

它们都可以做矩阵计算、切片、广播、变形。

但 PyTorch Tensor 有两个特别重要的能力：

可以放到 GPU 上计算
可以记录梯度，支持自动求导

这也是它能用于深度学习训练的关键。

常见操作

几个入门阶段最常用的操作：

x = torch.randn(2, 3)  x.shape x.reshape(3, 2) x.to("cuda") x.float() x.mean() x.sum()

这些操作不需要一次性背完，但要慢慢熟悉。

尤其是reshape、to(device)、float()，在训练代码里非常常见。

小结

Tensor 是 PyTorch 的基础数据对象。

先别被“张量”这个名字吓到。你可以把它理解成可以参与深度学习计算的多维数组。

学 PyTorch 时，多看 shape，多跟踪数据从输入到模型输出的变化，很多问题都会变得清楚。

技术图：把关键链路画清楚

可运行实验：同时检查 shape、dtype 与广播

Tensor 报错多数不是“数学太难”，而是形状、类型或设备不匹配。养成打印这三项的习惯，比盲目改代码有效。

import torch  x = torch.tensor([[1, 2, 3], [4, 5, 6]], dtype=torch.float32) bias = torch.tensor([0.1, 0.2, 0.3]) y = x + bias print("x:", tuple(x.shape), x.dtype, x.device) print("bias:", tuple(bias.shape)) print("y:\n", y)

运行结果：

x: (2, 3) torch.float32 cpu bias: (3,) y: tensor([[1.1000, 2.2000, 3.3000], [4.1000, 5.2000, 6.3000]])

bias只有 3 个元素，却能自动作用到两行数据上，这就是广播。广播很方便，但维度含义不清时也可能悄悄产生错误结果。

常见误区

Tensor 的维度越多越高级。维度只描述数据组织方式。
Shape 能对上就一定正确。相同 shape 也可能代表完全不同的语义。

动手练习

把bias改成 shape 为(2,)的 Tensor，观察报错并解释哪个维度无法匹配。

本文首发于「去你想去的地方」： Tensor 是什么？PyTorch 里最重要的对象讲清楚 | 去你想去的地方

完整学习路线、视频版和后续更新请访问原文。

查看全文

http://www.jsqmd.com/news/1099434/

而 C++ 就是这种能自举的编程语言

基于PI外环-FCS-MPC内环的永磁同步电机双环调速系统仿真分析（Simulink仿真实现）

【Claude】Claude Code CLAUDE.md 记忆系统完全指南：让 AI 永远记得你的项目规范

基于单片机智能点滴控制系统智能输液非接触式液位检测心率监测33(设计源文件+万字报告+讲解)（支持资料、图片参考_相关定制）_文章底部可以扫码

临沂GEO技术应用与合规解析

别再搞混了！JVM的Minor GC、Major GC、Full GC 到底有啥区别？

Java线程池使用指南

Java内存模型全面解析

基于STM32单片机甲烷煤气天然气报警厨房安全火灾报警火焰物联网3(设计源文件+万字报告+讲解)（支持资料、图片参考_相关定制）_文章底部可以扫码

04_C++控制结构

【Claude】Claude Code 自定义斜杠命令完全指南：把重复提示词变成一键命令

如何用UniversalUnityDemosaics轻松去除Unity游戏马赛克：免费完整指南

终极NxNandManager指南：轻松管理你的Switch NAND存储

基于51/STM32单片机智能马桶设计久坐提醒换气除臭杀菌消毒33(设计源文件+万字报告+讲解)（支持资料、图片参考_相关定制）_文章底部可以扫码

C++文件操作详解

C++智能指针开发实践

什么是 SIMD

Topit：让Mac窗口置顶的智能解决方案，告别窗口遮挡烦恼

M4Markets：技术架构的路径复盘

Windows本地安装Claude Desktop：API密钥配置与编程辅助实战指南