当前位置：首页 > news >正文

PyTorch张量操作实战：从创建到自动微分的完整指南（附代码示例）

news 2026/3/27 17:53:12

PyTorch张量操作实战：从创建到自动微分的完整指南（附代码示例）

深度学习框架PyTorch凭借其动态计算图和直观的API设计，已成为AI开发者的首选工具之一。本文将带您从零开始掌握PyTorch最核心的数据结构——张量（Tensor），通过可运行的代码示例演示创建、运算、自动微分等关键操作，帮助初学者快速构建项目实战能力。

1. 张量创建与基础属性

张量是PyTorch中的基本数据结构，可以理解为多维数组的扩展。与NumPy数组相比，PyTorch张量最大的优势在于支持GPU加速和自动微分功能。我们先看几种常见的创建方式：

import torch # 从Python列表直接创建 data_tensor = torch.tensor([[1, 2], [3, 4]]) # 创建特定形状的初始化张量 zeros_tensor = torch.zeros(2, 3) # 2行3列的全0张量 rand_tensor = torch.rand(3, 3) # 3x3的随机张量（均匀分布） # 从NumPy数组转换 import numpy as np numpy_array = np.array([5, 6, 7]) converted_tensor = torch.from_numpy(numpy_array)

每个张量都有三个关键属性需要特别关注：

数据类型：通过.dtype查看，常见类型包括torch.float32、torch.int64等
设备位置：.device显示张量位于CPU还是GPU上
形状信息：.shape或.size()返回张量的维度结构

提示：使用tensor = tensor.to(device)可以在CPU和GPU之间移动张量，记得先检查torch.cuda.is_available()

2. 张量运算与广播机制

PyTorch提供了丰富的数学运算接口，既支持运算符重载也包含函数式调用。以下是一些典型示例：

a = torch.tensor([1, 2, 3]) b = torch.tensor([4, 5, 6]) # 基本运算 add_result = a + b # 等价于torch.add(a, b) mul_result = a * b # 逐元素相乘 matmul = a @ b.T # 矩阵乘法（需要形状匹配） # 统计运算 sum_all = a.sum() # 所有元素求和 max_val, max_idx = a.max(dim=0) # 沿维度0求最大值及其索引

PyTorch的广播机制与NumPy类似，允许不同形状的张量进行运算。例如：

# 广播示例 matrix = torch.ones(3, 3) vector = torch.tensor([1, 2, 3]) result = matrix + vector # vector会被广播为3x3矩阵

常见运算方法对比：

运算类型	运算符	函数形式	说明
加法	`a + b`	`torch.add(a, b)`	逐元素相加
乘法	`a * b`	`torch.mul(a, b)`	逐元素相乘
矩阵乘	`a @ b`	`torch.matmul(a, b)`	线性代数乘法
求和	无	`a.sum(dim=...)`	可指定求和维度

3. 自动微分与梯度计算

PyTorch的自动微分系统（autograd）是其核心特性之一。要启用梯度跟踪，需要在创建张量时设置requires_grad=True：

x = torch.tensor(2.0, requires_grad=True) y = x ** 2 + 3 * x + 1 y.backward() # 自动计算梯度 print(x.grad) # 输出dy/dx在x=2处的值（应为7）

实际训练中常见的模式是：

# 模拟线性回归参数 w = torch.randn(3, requires_grad=True) b = torch.zeros(1, requires_grad=True) # 前向传播 inputs = torch.randn(10, 3) # 10个样本，每个3个特征 predictions = inputs @ w + b # 计算损失 targets = torch.randn(10) loss = torch.mean((predictions - targets) ** 2) # 反向传播 loss.backward() # 查看梯度 print(w.grad) # 损失对w的偏导 print(b.grad) # 损失对b的偏导

注意：调用.backward()后梯度会累积，训练时通常需要先用optimizer.zero_grad()清空梯度

4. 实战案例：线性回归实现

结合前面所学，我们实现一个完整的线性回归模型：

import torch import torch.optim as optim # 准备数据 X = torch.randn(100, 1) # 100个样本 true_w = torch.tensor([[2.0]]) true_b = 1.5 y = X @ true_w + true_b + torch.randn(100, 1)*0.1 # 添加噪声 # 初始化参数 w = torch.randn(1, requires_grad=True) b = torch.zeros(1, requires_grad=True) # 训练配置 learning_rate = 0.1 epochs = 100 optimizer = optim.SGD([w, b], lr=learning_rate) # 训练循环 for epoch in range(epochs): # 前向传播 predictions = X @ w + b loss = torch.mean((predictions - y) ** 2) # 反向传播 optimizer.zero_grad() loss.backward() # 参数更新 optimizer.step() if epoch % 10 == 0: print(f'Epoch {epoch}, Loss: {loss.item():.4f}') print(f'真实参数: w={true_w.item()}, b={true_b}') print(f'学习参数: w={w.item():.4f}, b={b.item():.4f}')

这个简单示例展示了PyTorch的核心工作流程：定义可训练参数、构建计算图、计算损失、反向传播更新参数。实际项目中，这些操作会被封装在nn.Module和DataLoader中实现更高效的训练。

5. 高效张量操作技巧

提升PyTorch代码效率的几个实用技巧：

视图操作：避免不必要的数据拷贝

a = torch.arange(10) b = a.view(2, 5) # 改变视图而不复制数据 c = a.reshape(5, 2) # 当连续时等同于view

原地操作：节省内存使用

a = torch.rand(3,3) a.add_(1) # 下划线表示原地操作 a.fill_(0) # 全部填充为0

批量处理：利用矩阵运算加速

# 低效方式 result = [] for x in data: result.append(model(x)) # 高效方式 batch = torch.stack(data) result = model(batch)

设备转移：优化GPU使用

device = 'cuda' if torch.cuda.is_available() else 'cpu' model = model.to(device) data = data.to(device)

掌握这些基础张量操作后，您可以更高效地实现各种深度学习模型。在实际项目中，建议结合torch.nn模块构建网络结构，使用DataLoader处理数据流，并利用torch.optim实现各种优化算法。

查看全文

http://www.jsqmd.com/news/495454/

金仓数据库在MySQL迁移中的技术观察：兼容性、安全合规与多行业落地实践

2026年内蒙古彩妆培训学校权威推荐：五大实力学校深度解析！ - 深度智识库

sse哈工大C语言编程练习45

Keil MDK-ARM避坑指南：STM32开发环境搭建中的5个常见错误及解决方法

DeepSeek + Kimi 一键安装 AI 编程助手教程（零基础 5 分钟）

tao-8k从零到一：跟着教程，10分钟搭建你的文本嵌入服务

基于STM32的跑步姿态检测与优化系统(论文+源码)

5个标签以上怎么放？图标用线性还是面性？兰亭妙微一次讲透底部Tab栏设计 - ui设计公司兰亭妙微

主流框架Detectron3介绍

python+Ai技术框架的爬虫基于的会议室预订系统设计与实现django flask

Python与CatBoost的顾客婚姻状态预测填补及特征类型策略分析 | 附代码数据

2026年口碑好的园林水景品牌厂家大盘点，看看哪家更靠谱 - 工业品网

NILMTK环境搭建实战：从Anaconda到Pycharm的避坑指南

【iOS】Fastlane自动化打包与分发：从TestFlight到蒲公英的完整实践

2026年泉州园林水景施工企业年度排名，揭秘哪家口碑更好 - 工业推荐榜

C#联合Halcon运动控制与视觉框架源码：连线式程序，开源可二次开发

中山大学团队联合中科院深研院推出EviAgent模型，既能自动生成高质量的放射科报告，又能满足全程可追溯、可解释的条件

2026年内蒙古学美容美发哪家好？呼和浩特市丽妍职业培训学校分析！ - 深度智识库

2026-双足行走机器人行业发展综述

最新数据公布！2026年这些岗位月薪六位数，普通人还能上车吗？

STC8H高级PWM功能详解：互补输出与死区时间配置指南

医疗系统如何通过百度WebUploader组件优化病历PDF文件的浏览器端分片断点恢复？

中2条以上，说明领导已经把你归为核心圈

基于Python常见地球科学数据（ERA5、雪深、积雪覆盖、海温、植被指数、土地利用）处理实践技术应用

智能合约 -透明可升级合约[ hardhat、openzeppelin 、ethers ]的演示 demo

useMemo vs useCallback：核心区别与使用场景

ACDC变换器：单相PFC_Boost+后级半桥LLC，功率因素矫正及软开关技术实现（300W...

2026年AI搜索优化公司深度测评：从技术到效果的客观分析与选型指南 - 小白条111

麟智产业通，为您的企业数字化需求保驾护航

HCIP 路由控制实验一