当前位置: 首页 > news >正文

NVIDIA TensorRT研究及模型加速使用

背景说明

在已有的服务器上部署了自己的项目代码,显卡是最新的PRO2000,但是处理的图像分辨率是1920*1080,视频帧频是20fps,进过分析代码发现,在直接使用pytorch训练的模型.pt算力有点吃紧,于是考虑通过转换模型格式来优化程序处理速度,从而改变前台画面的显示流畅度。值得一提的是,直接在windows上使用pip命令安装,很多时候编译都是错误额,因此考虑使用编译好的文件来安装。

分析说明

一般用pip install tensorrt會報錯並且卡在編譯失敗,這完全不是你的問題。在 Windows 系統下,直接用pip安裝 TensorRT 會試圖在你的電腦上進行 C++ 源碼編譯。如果你沒有完美安裝好對應版本的 Visual Studio C++ 編譯工具、環境變數,它 100% 會報錯。

既然這條路不通,我們就用工業界最正統的繞道方案。以下我為你準備了三個最有效的替代方案,強烈建議你優先使用方案一

🥇 方案一:官方 Zip 壓縮檔 + 本地安裝 Wheel (最推薦,絕對不用編譯)

NVIDIA 官方其實早就幫你把 Python 的安裝檔編譯好了,只是它藏在官方的 Zip 壓縮檔裡,而不是放在 PyPI (pip) 伺服器上。

執行步驟:

  1. 前往英偉達官網:登入 NVIDIA Developer 網站,進入 TensorRT 下載頁面。

  2. 選擇正確版本:根據你電腦上目前的CUDA 版本(例如 CUDA 11.8 或 12.1),下載對應的Windows Zip 壓縮包(通常叫做TensorRT-x.x.x.x.Windows10.x86_64.cuda-x.x.zip)。

  3. 解壓縮與設定環境變數:* 將下載的檔案解壓縮到 C 槽 (例如C:\TensorRT)。

    • C:\TensorRT\libC:\TensorRT\bin這路徑,加入到你 Windows 系統的「環境變數 -> Path」裡面 (這一步極度重要,否則 Python 找不到底層 DLL)。

  4. 手動安裝現成的 Python 套件 (避開編譯):

    • 打開終端機 (cmd),進入你解壓縮的目錄下的python資料夾:cd C:\TensorRT\python

    • 裡面會有很多.whl檔案 (Wheel 檔就是已經編譯好的二進制套件)。

    • 找到對應你 Python 版本的檔案 (例如 Python 3.10 就是cp310),然後執行:

      Bash
      pip install tensorrt-x.x.x-cp310-none-win_amd64.whl

    搞定!這樣安裝完全不會觸發編譯,1 秒鐘直接裝好!

🥈 方案二:轉戰 WSL2 (Windows Subsystem for Linux)

如果你發現在 Windows 下搞這些 CUDA、cuDNN、TensorRT 的路徑配置快讓你瘋掉,那我強烈建議你安裝 Windows 內建的WSL2 (Ubuntu)

  • 為什麼?Linux 是深度學習的「一等公民」。在 Ubuntu 下,NVIDIA 的套件支援度極高。

  • 在 WSL2 裡面,你甚至不需要自己去官網抓檔案,只要透過 Ubuntu 的apt-get或是直接pip install tensorrt,成功率都比 Windows 本機高出 90% 以上,省下極大的心力。

🥉 方案三:使用 C++ 轉換工具trtexec.exe(最硬核)

如果你只是為了「把 .pt 轉成 .engine」,而沒有要在 Python 程式碼裡import tensorrt進行二次開發,那你根本不需要在 Python 裡安裝 TensorRT!

  • 做法:按照方案一的步驟,把 TensorRT 的 Zip 檔解壓縮。

  • 直接轉換:進入C:\TensorRT\bin目錄,你會看到一個trtexec.exe檔案。

  • 先用 Python 把模型轉成 ONNX:yolo export model=your_model.pt format=onnx half=True

  • 然後直接用 CMD 呼叫這個.exe執行檔幫你編譯 Engine:

    Bash
    trtexec.exe --onnx=your_model.onnx --saveEngine=your_model.engine --fp16

    這樣完全繞開了 Python 環境的依賴泥淖!

這三種方案都能幫你擺脫pip編譯失敗的噩夢。在你去 NVIDIA 官網下載之前,請問你目前電腦上安裝的 CUDA 版本是多少呢? (可以在終端機輸入nvcc -V查看)確認版本後我能告訴你下載哪一個 TensorRT 最不會踩坑!

资源分享

下载网址:NVIDIA TensorRT | NVIDIA 开发者

需要先注册账号,如果已经有账号,登录即可。

可用版本如下:

在这里根据自己的显卡和Cuda选择时候自己的版本:

下载问价大概2个G左右,下载后解压缩文件夹如下:

📦 為什麼 TensorRT 這麼肥大?

  1. 底層硬體驅動函式庫 (DLLs):裡面塞滿了可以直接跟你的 RTX Pro 2000 顯示卡晶片對話的底層 C++ 編譯動態連結庫 (.dll)。這些檔案為了追求極致效能,體積都非常大。

  2. 多代顯卡支援 (Fat Binaries):NVIDIA 為了讓這個安裝包能跑在不同世代的顯卡上(例如你的 Turing/Ampere 架構、最新的 Ada/Hopper 架構),裡面包含了針對每一種晶片架構單獨編譯的指令集。

  3. 神兵利器trtexec.exe我們上一回合提到的,那個可以直接繞過 Python、用 C++ 底層幫你把.onnx暴力轉成.engine的官方編譯器,就藏在裡面的bin資料夾下。

  4. 全套 Python Wheel 檔合集:為了不用編譯,它在python資料夾裡面,直接塞滿了給 Python 3.8、3.9、3.10、3.11、3.12 所有版本的免編譯安裝檔 (.whl)。

结果

成功重启后,第一张图片处理会比较慢,因为要加载,后续处理速度明显提高,推理速度从40-60ms降低到了15-25ms左右。

http://www.jsqmd.com/news/987226/

相关文章:

  • 目前HARTING连接器供应商
  • 辐射发射超标,磁环套了一个又一个还是压不住
  • 告别USB数据泄露与丢失:企业级文件镜像策略,这样部署才高效!
  • 一个消息回调的设计哲学:论个人微信 API 的 Webhook 钩子怎么用才不踩坑
  • 2026商户选源头厂家直供手办开店平台怎么选:功能全性价比突 - 13724980961
  • 计算机毕业设计之智能教学资源推荐系统分析设计与实现
  • 美妆包装设计实战复盘:基于符号化与系列化思维打造差异化视觉体系
  • AI 热点驱动的钓鱼攻击形态、危害与全域防御体系研究
  • 安徽滁州食品输送设备生产厂家TOP1:安徽宏冠智能设备有限公司实力测评 - 百航
  • 2026年湖南高考物理试卷试题真题及答案解析
  • 2026 合肥卖黄金必看!避开这些套路,别让你的金饰被压价 - 开心测评
  • 【多模态大模型面经】Transformer专题面经
  • 创业多年悟透:普通人的底气,从来不是暴富,是稳稳的坚持
  • 实验室CMA/CNAS认证过程中,授权签字人的签字权限如何确定与管理?
  • 微信小程序计算机毕设之基于springboot+微信小程序的问卷调查管理系统小程序基于微信小程序的调查问卷管理系统(完整前后端代码+说明文档+LW,调试定制等)
  • 如何通过服务商购买企微会话存档更划算?3 个省钱技巧 + 避坑指南
  • 局域网赛事投屏系统开发:协议选型与模块拆分思路
  • 企业新媒体矩阵规模化后的治理结构与数据能力研究(2026)
  • docker无法连接到ollama服务的问题排查和解决方案
  • 什么是B2B:企业对企业完整指南(2026)
  • 估值3500亿!DeepSeek融资后两手抓:算力基建与上层应用剑指何方?
  • 分析AGV叉车与传统叉车的优缺点
  • 深度学习入门到实战
  • Shulex VOC优惠码适合谁用?从评论分析到产品改款的实战判断 - 麦麦唛
  • 小程序毕业设计-基于springboot+微信小程序的文化旅游小程序系统文化展示、旅游攻略、智能推荐(源码+LW+部署文档+全bao+远程调试+代码讲解等)
  • 小程序毕设选题推荐:基于SpringBoot问卷调查系统微信小程序【附源码、mysql、文档、调试+代码讲解+全bao等】
  • 新能源车企如何用AI大模型自救?RAG/Agent/Text-to-SQL三场景实战
  • 伊犁轻松游旅行社排行:从行程设计到服务体验拆解 - 互联网科技品牌测评
  • Markdown 编辑器完全指南:从入门到精通
  • java优化小技巧