当前位置: 首页 > news >正文

深入解析:1、Pytorch介绍与安装

1、Pytorch介绍

PyTorch 是由 Facebook AI Research (FAIR) 团队开发并维护的一款开源深度学习框架,于 2016 年首次发布。它因其直观的设计、卓越的灵活性以及强大的动态计算图功能,迅速在学术界和工业界获得了广泛认可,成为当前深度学习研究和开发的主流工具之一。

1.1、核心理念

PyTorch 最显著的特点是其 “Pythonic” 的设计哲学和 动态计算图 (Dynamic Computational Graph) 机制。

  1. Pythonic 设计: PyTorch 深度融入 Python 生态系统,其 API 设计自然、简洁,非常符合 Python 程序员的思维习惯。你可以像操作普通的 Python 对象(如 NumPy 数组)一样操作张量(Tensor),使用标准的 Python 控制流(如 ifforwhile)来构建模型结构。这种无缝集成极大地降低了学习门槛,让开发者能够专注于模型设计和算法本身,而非框架的复杂性。

  2. 动态计算图 (Define-by-Run): 这是 PyTorch 区别于早期静态图框架(如 TensorFlow 1.x)的关键。计算图在代码运行时动态构建。每一步张量操作都会实时扩展计算图,并立即执行。这种机制带来了革命性的优势:

1.2、核心组件与功能

PyTorch 提供了一套完整的工具链来支持深度学习工作流:

  1. 强大的张量库: torch.Tensor 是其核心数据结构,支持高效的 CPU 和 GPU 加速计算。它提供了丰富的数学运算(线性代数、随机数生成等),并高度兼容 NumPy(通过 .numpy() 和 torch.from_numpy() 轻松转换)。

  2. 自动微分引擎 (Autograd): torch.autograd 模块是 PyTorch 的基石。它通过在动态计算图上自动追踪张量操作,实现反向传播时梯度的自动计算。只需在张量上设置 .requires_grad=True,框架就会记录所有相关操作,并在调用 .backward() 时自动计算梯度。这极大地简化了梯度计算,让开发者无需手动推导和实现复杂的反向传播。

  3. 神经网络模块 (torch.nn): 该模块提供了构建神经网络所需的所有基础构件:

    • 层 (Layers): 预定义了各种层(如 Linear, Conv2d, RNN, LSTM, Transformer, Dropout, BatchNorm 等)。

    • 损失函数 (Loss Functions): 如 MSE, CrossEntropyLoss 等。

    • 优化器 (Optimizers): 如 SGD, Adam, RMSprop 等,用于更新模型参数以最小化损失。

    • 容器 (Containers): nn.Module 是构建所有模型的基类。通过继承它并定义 forward 方法,可以轻松组合各种层来创建复杂的网络结构。nn.Module 还自动管理参数、设备移动(CPU/GPU)、序列化等。

  4. 数据加载与处理 (torch.utils.data):

    • Dataset 类: 定义如何访问单个样本。

    • DataLoader: 负责高效地批量加载数据、打乱顺序、多进程预读取等,是训练循环中数据供给的核心。

    • Transforms: 提供丰富的图像和数据处理工具(如裁剪、旋转、归一化),用于数据增强和预处理。

  5. GPU 加速: PyTorch 天然支持 CUDA。只需将张量或模型移动到 GPU 设备(.to(‘cuda’)),即可利用 NVIDIA GPU 强大的并行计算能力,显著加速模型训练和推理。

  6. 分布式训练: torch.distributed 模块提供了强大的工具(如 DistributedDataParallel - DDP),支持在多 GPU、多节点集群上进行高效的数据并行和模型并行训练,极大缩短大型模型的训练时间。

  7. TorchScript 和 TorchDynamo (PyTorch 2.x): 为了满足生产环境对性能、部署和脱离 Python 环境运行的需求,PyTorch 提供了:

  8. 丰富的生态系统:

1.3、适用场景与优势总结

  • 研究与原型开发: 动态图的灵活性和易调试性使其成为学术研究和快速实验新想法的理想平台。大量前沿论文的官方实现都基于 PyTorch。

  • 教学与学习: Pythonic 的设计和直观的调试使其成为学习深度学习的绝佳工具。

  • 计算机视觉 (CV): 在图像分类、目标检测、分割等任务中占据主导地位。

  • 自然语言处理 (NLP): 是 Transformer 等现代 NLP 模型实现和预训练模型库(如 Hugging Face)的主要支撑。

  • 强化学习、生成模型等: 其灵活性同样适用于这些新兴且结构多变的领域。

  • 生产部署: 随着 TorchScript、TorchDynamo (torch.compile()) 以及部署工具链的成熟,PyTorch 在生产环境中的应用也日益广泛。

1.4、优势总结

2、安装Pytorch

2.1、通过官网安装

 ubuntu系统安装cuda驱动、cudatoolkit、cuDNN教程见:

1、安装cuda驱动,cuda toolkit和cuDNN-CSDN博客

查看cuda版本:

(llm) wangqiang@wangqiang:~$ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2025 NVIDIA Corporation
Built on Wed_Jan_15_19:20:09_PST_2025
Cuda compilation tools, release 12.8, V12.8.61
Build cuda_12.8.r12.8/compiler.35404655_0

 最新的pytorch只支持pip安装,去官网Get Started查看PyTorch的安装需求和安装命令。

ubuntu系统安装pytorch 12.8:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128

查看安装的pytorch版本:

方式1:

import torch
print(torch.__version__)

方式2:

终端中运行:

(llm) wangqiang@wangqiang:~$ pip show torch
Name: torch
Version: 2.7.0+cu128
Summary: Tensors and Dynamic neural networks in Python with strong GPU acceleration
Home-page: https://pytorch.org/
Author: PyTorch Team
Author-email: packages@pytorch.org
License: BSD-3-Clause
Location: /home/wangqiang/anaconda3/envs/llm/lib/python3.12/site-packages
Requires: filelock, fsspec, jinja2, networkx, nvidia-cublas-cu12, nvidia-cuda-cupti-cu12, nvidia-cuda-nvrtc-cu12, nvidia-cuda-runtime-cu12, nvidia-cudnn-cu12, nvidia-cufft-cu12, nvidia-cufile-cu12, nvidia-curand-cu12, nvidia-cusolver-cu12, nvidia-cusparse-cu12, nvidia-cusparselt-cu12, nvidia-nccl-cu12, nvidia-nvjitlink-cu12, nvidia-nvtx-cu12, setuptools, sympy, triton, typing-extensions
Required-by: torchaudio, torchvision

卸载pytorch

sudo pip uninstall torch torchvision torchaudio# 删除缓存和配置文件:
rm -rf ~/.cache/torch
rm -rf ~/.local/bin/torch_shm_manager

2.2、从源码安装

如果需要从源代码安装PyTorch,或者想要尝试最新的开发版本,可以使用以下命令:

git clone --recursive https://github.com/pytorch/pytorch
cd pytorch
python setup.py install

2.3、通过pip安装

pip install torch torchvision torchaudio
  • 默认安装的是 CPU 版本(不包含 GPU 支持),除非在系统环境已经明确配置了 CUDA 并且 PyPI 源中存在对应的 GPU 版本。
  • 安装的版本是 PyPI 上的最新稳定版(可能不是与电脑硬件或Python 版本完全兼容的版本)。

3、Pytorch参考链接

PyTorch 官网 :https://pytorch.org/

PyTorch 官方入门教程:Get Started

PyTorch 官方文档:PyTorch documentation — PyTorch 2.7 documentation 

PyTorch 源代码:https://github.com/pytorch/pytorch

PyTorch 官方英文教程:Welcome to PyTorch Tutorials — PyTorch Tutorials 2.7.0+cu126 documentation

PyTorch 官方中文文档:主页 - PyTorch中文文档

RUNOOB PyTorch教程:PyTorch 教程 | 菜鸟教程

http://www.jsqmd.com/news/8895/

相关文章:

  • Atbash密码和摩斯密码
  • Redis 中如何保证缓存与数据库的内容一致性?
  • SQL Indexes(索引) - 详解
  • Payload CMS:开发者优先的Next.js原生开源解决优秀的方案,重新定义无头内容管理
  • 07. 自定义组件
  • CF1611E2 Escape The Maze (hard version)
  • python语法记录
  • 详细介绍:Go 语言 + Word 文档模板:WordZero 引擎如何让企业文档处理效率提升 300%?
  • Go 即时通讯体系:客户端与服务端 WebSocket 通信交互
  • 2025 年储罐厂家推荐最新公司权威排行榜榜单发布,深度解析衬四氟储罐 / 硫酸储罐 / 盐酸储罐工厂选购指南
  • 读混元image论文
  • 实用指南:跳动的爱心
  • UnicodeEncodeError: locale codec cant encode character \u5e74 in position 2: encoding error
  • 2025 年生物除臭设备厂家最新推荐排行榜:覆盖污水处理厂 / 垃圾中转站等多场景,助力企业精准挑选优质设备
  • 从理念到沙盘:用悟空博弈模拟器点亮人机共治的曙光
  • 深入解析:Redis事务详解:原理、使用与注意事项
  • phone num
  • Perplexity发布搜索API,驱动下一代AI应用开发
  • PWN手的成长之路-09-SWPUCTF 2023 秋季新生赛Shellcode
  • 20251005 总结
  • OKR1
  • 云数据库选型指南:关系型 vs NoSQL vs NewSQL的企业决策 - 指南
  • 详细介绍:AI觉醒前兆,ChatGPT o3模型存在抗拒关闭行为
  • 当 Python 遇上 Go:Sponge 如何成为替代 Django/Flask 的理想选择 - 指南
  • 2025 年装盒机制造厂 TOP 企业品牌推荐排行榜,自动化 / 喷胶 / 牙膏 / 手机壳 / 3C 数码 / 内外盒 / 面膜 / 电子产品 / 玩具 / 日用品装盒机推荐这十家公司!
  • 英语_阅读_Chinas Spring Festival_待读
  • 2025 年自动包装生产线 TOP 企业品牌推荐排行榜!食品行业 / 日化产品 / 智能化 / 小型 / 多功能集成 / 柔性 / 后道 / 高速自动包装生产线推荐!
  • api调用钉钉群机器人发信息 - 规格严格
  • AI 自我理解边界
  • 2025 年氢氧化铝生产厂家 TOP 品牌榜单来袭,阻燃,高白,酸融,导热,超细,微粉级,低粘度,灌封胶用,覆铜板用氢氧化铝公司推荐!