当前位置: 首页 > news >正文

服务器安装nvidia驱动+cuda+cudnn+torch

1. 驱动安装

下载 NVIDIA 官方驱动 | NVIDIA

官方网站下载对应的驱动, 选择560.35.03版本。

1.1 卸载本机驱动

sudo apt remove --purge nvidia*

1.2 禁用nouveau

1.2.1 备份文件(以下均在root用户下操作)

cp /etc/modprobe.d/blacklist.conf /etc/modprobe.d/blacklist.conf.backup

1.2.2 修改文件

vim /etc/modprobe.d/blacklist.conf

在文件末尾添加如下内容:

blacklist nouveau blacklist lbm-nouveau options nouveau modeset=0 alias nouveau off alias lbm-nouveau off

关闭nouveau:echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf

更新:sudo update-initramfs -u

重启服务器:init 6

重启后查看是否禁用成功:lsmod | grep nouveau(没有任何输出内容则为成功禁用)

1.2.3 安装驱动

驱动文件赋予执行权限:chmod 755 NVIDIA-Linux-x86_64-560.35.03.run

./NVIDIA-Linux-x86_64-560.35.03.run --no-opengl-files -no-x-check -no-nouveau-check

重启:init 6

查看驱动安装是否成功:nvidia-smi

驱动与cuda版本对应表查询:CUDA 12.6 Update 1 Release Notes

2. cuda12.6安装

https://developer.nvidia.com/cuda-12-6-0-download-archive?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=20.04&target_type=deb_local

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600 wget https://developer.download.nvidia.com/compute/cuda/12.6.0/local_installers/cuda-repo-ubuntu2004-12-6-local_12.6.0-560.28.03-1_amd64.deb sudo dpkg -i cuda-repo-ubuntu2004-12-6-local_12.6.0-560.28.03-1_amd64.deb sudo cp /var/cuda-repo-ubuntu2004-12-6-local/cuda-*-keyring.gpg /usr/share/keyrings/ sudo apt-get update sudo apt-get -y install cuda-toolkit-12-6

查看cuda安装是否成功:

如果出现异常:Command 'nvcc' not found, but can be installed with,千万不要apt install nvidia-cuda-toolkit 去安装,否则会重新安装cuda。

需要配置环境变量:~/.bashrc文件末尾添加两行,source ~/.bashrc

export LD_LIBRARY_PATH=/usr/local/cuda/lib64 export PATH=$PATH:/usr/local/cuda/bin

3.cudnn

下载地址:https://developer.nvidia.com/rdp/cudnn-archive,下载tar包。

安装:

tar -xvf cudnn-linux-x86_64-8.9.7.29_cuda12-archive.tar.xz cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include cp -P cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64 chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

验证:

cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

新版本地址:https://developer.nvidia.com/cudnn-archive

4. torch安装

这里一定要去官网找匹配自己环境的版本:Get Started

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126

在ubuntu24.04系统中直接安装有可能会报错:error: externally-managed-environment

为了规避该不兼容问题,需要修改(这里对应系统中的python版本):

mv /usr/lib/python3.12/EXTERNALLY-MANAGED /usr/lib/python3.12/EXTERNALLY-MANAGED.bak
http://www.jsqmd.com/news/534916/

相关文章:

  • javaweb项目完整案例SSM框架实现的校园二手交易网站
  • DeepSeek-R1(1.5B)效果实测:1.5B参数实现7B级别推理能力的秘密
  • linux服务器性能查看
  • DanKoe 视频笔记:个人商业模式:如何通过解决自己的问题来获利
  • [a股]操盘相似性
  • QAnything古籍数字化:繁体竖排文本的解析之道
  • ACE-Step优化升级:开启torch_compile加速,生成速度提升20%
  • 嵌入式开发中开源组件的工程实践与优化
  • Linux 安装 Docker 详细步骤(保姆级教程),亲测可用
  • 避坑指南:Unity粒子系统做星星特效时最容易忽略的3个细节(附材质包)
  • 2026年3月苏州减震台座厂家最新推荐:水泵减震器、冷水机组减震器、变压器减震器、冷却塔减震器、浮筑楼板减震器厂家选择指南 - 海棠依旧大
  • 如何实现百万级WebSocket连接:Go语言高性能架构完全指南
  • 从AlphaGo到ChatGPT:拆解AI巨头产品背后的‘三派’混血技术
  • ThreadX系统服务:从事件链到优先级继承的深度解析
  • DMXAPI 和 Filesystem MCP Tool 能解决什么:一篇偏工程经验的总结
  • 如何快速搭建MiroFish预测引擎:3种高效部署方案全解析
  • Arcgis进阶指南:影像镶嵌与裁剪的高效操作技巧
  • 嵌入式老司机教你玩转Hi3520DV400:NOR/NAND双启动配置与TFTP极速烧写技巧
  • 常见编程错误单词总结
  • 一键部署Qwen3-ASR-1.7B:快速搭建个人语音助手与会议纪要工具
  • 别再乱存Token了!Laravel+jwt-auth安全实践指南(LocalStorage vs Cookie对比)
  • 嵌入式系统数据可移植性设计与实现
  • Allegro PCB设计实战:约束规则管理中的5个高频坑点及解决方案
  • HDMI高速差分信号的长度匹配与EMI问题
  • MATLAB App Designer实战指南:从零打造你的第一个交互式GUI应用
  • 别再手动删缓存了!Nginx缓存配置实战:从proxy_cache到purge模块的完整避坑指南
  • BeepBox:释放音乐创造力的零门槛工具 - 零基础创作者指南
  • 华为S5700交换机在eNSP中的实战配置:从VLAN划分到SSH安全登录
  • Fluent气动噪声 - 旋转机械风扇风机气动噪声仿真教学在线—重叠网格
  • 别再死记硬背了!用eNSP亲手‘破坏’一次网络,彻底搞懂OSPF Router-ID的选举和唯一性有多重要