当前位置: 首页 > news >正文

PyTorch 深度学习开发 常见疑难报错与解决方案汇总

本文旨在系统记录使用 PyTorch 进行深度学习开发过程中遇到的各类疑难报错与异常问题,详细梳理报错现象、排查思路及最终解决方案。一方面是为了复盘问题解决过程,沉淀技术经验;另一方面也能避免后续再次遇到同类问题时重复踩坑,提升开发效率。

1 使用torchrun报错

failed to create process.
找到D:\LMZFile\Anaconda3\envs\bisenet\Scripts\torchrun-script.py,修改第一行的python环境,如下图所示:

2 conda activate报错

CommandNotFoundError: Your shell has not been properly configured to use 'conda activate'.

报错原因:当前的 shell 进程没有加载最新的.bashrc配置(conda init的配置会写入.bashrc,但仅对新进程生效)。
解决办法:

source ~/.bashrc

3 PyTorch 与 CUDA 相关核心报错

3.1 CUDA 内核加载报错

CUDA error: no kernel image is available for execution on the device

问题根因
版本不匹配核心问题:当前安装的 CUDA Toolkit 版本、PyTorch 版本、本地 GPU 硬件型号 三者之间不兼容,PyTorch 编译时内置的 CUDA 内核镜像,无法适配当前 GPU 的硬件算力,导致内核无法加载执行。
解决方案
根据本地 GPU 的计算能力(Compute Capability),重新安装与之匹配的 PyTorch + CUDA 版本组合,确保三者算力与版本完全兼容。

3.2 GPU 算力不兼容报错

报错现象
Tesla P40 with CUDA capability sm_61 is not compatible with the current PyTorch installation. The current PyTorch install supports CUDA capabilities sm_70 sm_75 sm_80 sm_86 sm_90 sm_100 sm_120.
问题根因
当前安装的 PyTorch 版本,在编译阶段仅对算力值 sm_70及以上 的显卡做了适配支持;而本地使用的 Tesla P40 显卡算力值为 sm_61,不在该 CUDA版本的支持范围内,因此触发算力不兼容报错。
补充说明
若不清楚自身显卡对应的算力值(Compute Capability),可参考 NVIDIA 官方算力查询地址,精准查询显卡型号对应的算力版本:NVIDIA 官方显卡算力对照表
如图所示我的是这一栏的:

下图是算力与CUDA对照表:

源地址在这里:CUDA#GPUs_supported
注:上述图仅供参考,虽然上述写的12x支持6.1算力,但是据我尝试,12x的cuda还是会报错,找官网说是为了减少torch的体积,将cuda给阉割了.
我这里直接安装11.8版本的torch:

pipinstalltorch==2.7.1torchvision==0.22.1torchaudio==2.7.1 --index-url https://download.pytorch.org/whl/cu118

4 PyTorch 版本导入包相关错误

ImportError: cannot import name ‘PytorchGELUTanh‘ from ‘transformers.activations‘
在/xxx/anaconda3/envs/llamafactory/lib/python3.11/site-packages/transformers/activations.py目录下添加以下代码:

PytorchGELUTanh=GELUTanh

如下图所示:

http://www.jsqmd.com/news/478172/

相关文章:

  • Qwen3-ForcedAligner技术精讲:清音刻墨对齐算法在低信噪比下的鲁棒性设计
  • CasRel关系抽取模型效果展示:学术论文参考文献中‘作者-引用-论文’关系网络构建
  • Python 潮流周刊#142:Python 性能优化的进阶之路
  • InstructPix2Pix惊艳案例:‘Add vintage film effect’胶片滤镜生成效果
  • 前端技术核心领域与实践方向
  • 探究Redis + Caffeine两级缓存架构
  • AIGlasses_for_navigation部署教程:华为昇腾910B适配AscendCL加速指南
  • 灵感画廊入门必看:SDXL 1.0提示词工程从‘指令式’到‘文学式’跃迁
  • MusePublic Art Studio实操手册:从输入描述到保存高清作品完整流程
  • Cogito 3B真实输出:从模糊业务需求到数据库ER图+SQL Schema+API设计
  • DeepSeek-OCR-2效果展示:低对比度铅印老报纸PDF→段落/标题/广告栏结构化分离效果
  • Docker离线安装包构建(一键安装,多平台适用)
  • 2026年初绝育犬狗粮口碑盘点:科学喂养趋势下的品牌选择 - 2026年企业推荐榜
  • 2026年初,海淀中科院园所旁优质艺术机构深度评测 - 2026年企业推荐榜
  • StructBERT-Large中文模型开源大模型部署:全链路本地化语义分析方案
  • AWPortrait-Z WebUI界面深度解读:输入/输出/历史三区协同操作逻辑
  • MGeo中文地址结构化模型Gradio部署:批量地址解析与Excel导入导出
  • 漫画脸描述生成行业落地:动漫教育机构学生角色创作作业智能批改辅助系统
  • Bidili Generator实战落地:电商运营用它日均生成200+商品场景图
  • 硬盘读写的生命周期的庖丁解牛
  • Qwen3-ForcedAligner-0.6B部署教程:低配GPU(8GB显存)上的轻量级运行方案
  • Gemma-3-12b-it本地化部署标准:符合等保2.0要求的数据安全配置项
  • gemma-3-12b-it实操手册:上传图片+提问→获取结构化分析结果全流程
  • CLIP-GmP-ViT-L-14图文匹配工具效果展示:多候选文本排序结果+可视化进度条实录
  • 2026北京二手房翻新公司深度评测:五强争霸谁主沉浮? - 2026年企业推荐榜
  • EasyAnimateV5-7b-zh-InP参数详解:Sampling Method(Flow算法)原理与选型
  • Nunchaku FLUX.1 CustomV3快速部署:镜像免配置+单卡RTX4090开箱即用方案
  • GLM-4-9B-Chat-1M实战教程:用OpenWebUI构建企业内部知识问答机器人
  • 2026年初太原工程资质合作服务商专业深度测评 - 2026年企业推荐榜
  • AI读脸术省钱方案:无GPU部署人脸分析系统实战指南