当前位置: 首页 > news >正文

linux 安装 Nvidia 显卡驱动,配置 NVIDIA Container Toolkit

以 ubuntu-server 24.04 上运行 netdata v1.47 为例

一、驱动安装

1、安装显卡驱动

https://www.nvidia.com/en-us/drivers/

选择显卡型号下载驱动安装文件,比如:NVIDIA-Linux-x86_64-580.126.09.run

执行安装:

chmod +x NVIDIA-Linux-x86_64-580.126.09.run
./NVIDIA-Linux-x86_64-580.126.09.run

2、验证驱动是否安装成功

执行 nvidia-smi,观察终端是否有如下返回:

root@ubuntu:~# nvidia-smi
Fri Jan 23 14:33:13 2026       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 580.126.09             Driver Version: 580.126.09     CUDA Version: 13.0     |
+-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce RTX 3050        Off |   00000000:01:00.0 Off |                  N/A |
| 30%   24C    P8             10W /   70W |       0MiB /   6144MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------++-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
|  No running processes found                                                             |
+-----------------------------------------------------------------------------------------+

3、安装 NVIDIA Container Toolkit

https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html

二、docker 配置

1、配置 daemon.json

nvidia-ctk runtime configure --runtime=docker --set-as-default

命令运行完后会在 /etc/docker/daemon.json 中添加红色加粗部分

{"bip": "192.168.222.1/24","default-runtime": "nvidia","log-driver": "json-file","log-opts": {"max-file": "5","max-size": "10m"},"runtimes": {"nvidia": {"args": [],"path": "nvidia-container-runtime"}}
}

cat /etc/docker/daemon.json 确保红色部分添加成功

2、重启 docker 服务

systemctl daemon-reload
systemctl restart docker

三、容器配置

1、添加 deploy 配置(红色加粗部分)

services:netdata:image: netdata/netdata:v1.47container_name: netdatahostname: ubuntu-netdatapid: hostports:- 19999:19999restart: unless-stoppedcap_add:- SYS_PTRACE- SYS_ADMINsecurity_opt:- apparmor:unconfinedenvironment:- DEFAULT_LANGUAGE=zh_CNvolumes:- ./netdataconfig/netdata:/etc/netdata- netdatalib:/var/lib/netdata- netdatacache:/var/cache/netdata- /:/host/root:ro,rslave- /etc/passwd:/host/etc/passwd:ro- /etc/group:/host/etc/group:ro- /etc/localtime:/etc/localtime:ro- /proc:/host/proc:ro- /sys:/host/sys:ro- /etc/os-release:/host/etc/os-release:ro- /var/log:/host/var/log:ro- /var/run/docker.sock:/var/run/docker.sock:ro
    deploy:resources:reservations:devices:- driver: nvidiacount: allcapabilities: [gpu]volumes:netdatalib:netdatacache:

2、启动 compose,在容器中验证 nvidia-smi

docker exec -it netdata nvidia-smi

观察终端是否有如下返回:

root@ubuntu:~# docker exec -it netdata nvidia-smi
Fri Jan 23 14:34:28 2026       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 580.126.09             Driver Version: 580.126.09     CUDA Version: 13.0     |
+-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce RTX 3050        Off |   00000000:01:00.0 Off |                  N/A |
| 30%   24C    P8             10W /   70W |       0MiB /   6144MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------++-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
|  No running processes found                                                             |
+-----------------------------------------------------------------------------------------+

如有返回则表示容器已经可以使用 gpu 资源

 

参考链接:

https://learn.netdata.cloud/docs/netdata-agent/installation/docker

https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html

 

http://www.jsqmd.com/news/290534/

相关文章:

  • Django REST Framework (DRF) 认证与异常处理完全指南
  • ESP32-S3定义输出引脚+延时亮灭
  • 使用cppcheck对代码静态分析
  • Java毕设选题推荐:基于SpringBoot+vue的演唱会门票购票网站系统基于springboot的演出网站订票系统【附源码、mysql、文档、调试+代码讲解+全bao等】
  • 01vue3学习-创建项目
  • Java毕设项目:基于springboot的演出网站订票系统(源码+文档,讲解、调试运行,定制等)
  • 【毕业设计】基于springboot的演出网站订票系统(源码+文档+远程调试,全bao定制等)
  • 土壤水分温度盐分ph测定仪:可同步获取土壤水分、温度、盐分(电导率)及pH值等关键指标
  • LeGO-LOAM 激光里程计计算roll,pitch,tz增量详解
  • 字符设备驱动程序
  • testing
  • 两个 Docker 容器如何通信?Docker 网络问题完整踩坑与解决指南
  • 芒格的“避免失败“原则在前沿科技投资中的重要性
  • 关与短链接API,其中稳定无毒的少之又少。
  • 数据结构——冒泡排序 - 教程
  • 机械制造ToB企业获客困境与数字化解决方案架构深度解析
  • Java毕设项目:基于springboot的二次元商品商城系统(源码+文档,讲解、调试运行,定制等)
  • Java计算机毕设之基于SpringBoot + Vue的电子产品手机数码销售系统基于springboot的电子产品电子外设销售系统(完整前后端代码+说明文档+LW,调试定制等)
  • 【毕业设计】基于springboot的二次元商品商城系统(源码+文档+远程调试,全bao定制等)
  • 【课程设计/毕业设计】基于springboot的电子产品销售系统基于springboot的电子产品电子外设销售系统【附源码、数据库、万字文档】
  • 【课程设计/毕业设计】基于SpringBoot与Vue的动漫周边商场系统设计与实现基于springboot的二次元商品商城系统【附源码、数据库、万字文档】
  • MyEMS开源能源管理系统:赋能生物化学农药及微生物农药制造业绿色低碳转型
  • 开源驱动零碳实践:MyEMS 赋能零碳工厂建设的核心路径
  • 服装加工ERP系统是什么?它能为企业带来哪些效率提升?
  • 【工具变量】全国地级市文旅融合DID数据集(2008-2025年)
  • 10399_基于SpringBoot的智慧养老院管理系统
  • 诺斯罗普·格鲁曼加速辐射测试
  • 代码源挑战赛 Round 47
  • 26年1月23算法
  • 编辑标题