当前位置：首页 > news >正文

保姆级避坑指南：在Ubuntu 20.04上从零搭建BoT-SORT多目标追踪环境（含PyTorch 1.7.1 + CUDA 10.1配置）

news 2026/5/14 13:16:40

Ubuntu 20.04环境下的BoT-SORT多目标追踪实战避坑手册

1. 环境配置：从零开始的正确姿势

在Ubuntu 20.04上搭建BoT-SORT环境就像组装一台精密仪器，每个零件都需要严丝合缝。我们先从最基础的Python虚拟环境说起：

conda create -n botsort_env python=3.7 -y conda activate botsort_env

关键依赖安装顺序直接影响成功率。以下是经过验证的最佳实践：

PyTorch 1.7.1 + CUDA 10.1组合（注意版本号必须精确匹配）：

conda install pytorch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2 cudatoolkit=10.1 -c pytorch

LAP库的特别处理：当遇到legacy-install-failure错误时，改用conda安装：

conda install -c conda-forge lap

提示：如果conda环境退出时报deactivate does not accept arguments错误，直接使用conda deactivate即可

2. 源码部署：那些官方文档没告诉你的细节

克隆仓库后，执行以下步骤前请确保位于项目根目录：

git clone https://github.com/NirAharon/BoT-SORT.git cd BoT-SORT

依赖安装的隐藏陷阱：

COCO API需要单独编译安装：

pip3 install cython pip3 install 'git+https://github.com/cocodataset/cocoapi.git#subdirectory=PythonAPI'

FAISS的选择取决于硬件配置：

# CPU版本 pip3 install faiss-cpu # 或GPU版本 pip3 install faiss-gpu

开发模式安装的正确方式：

pip3 install -r requirements.txt python3 setup.py develop

3. 数据集处理：避开那些"坑爹"的压缩包

MOT挑战赛数据集下载和解压是个技术活，这里有几个救命技巧：

后台下载技巧：

nohup wget https://motchallenge.net/data/MOT17.zip & nohup wget https://motchallenge.net/data/MOT20.zip &

注意：遇到End-of-central-directory signature not found错误时，说明下载中断，必须删除不完整压缩包重新下载

数据集预处理的关键命令：

# MOT17处理 python3 fast_reid/datasets/generate_mot_patches.py --data_path ../datasets --mot 17 # MOT20处理（目录结构不同） python3 fast_reid/datasets/generate_mot_patches.py --data_path ../datasets --mot 20

目录结构要求（必须严格遵循）：

fast_reid/datasets/ ├── MOT17-ReID/ # 由MOT17_ReID重命名而来 └── MOT20/ └── MOT20-ReID/ # 由MOT20_ReID重命名而来

4. 模型训练：从报错中杀出一条血路

训练阶段是问题高发区，以下是实战中总结的解决方案：

预训练模型处理：

直接从官方Model Zoo下载MOT17-SBS-S50和MOT20-SBS-S50
手动上传到BOT-SORT/pretrained目录
遇到权重下载慢时，本地下载后通过SFTP上传

训练命令示例：

python3 fast_reid/tools/train_net.py \ --config-file ./fast_reid/configs/MOT17/sbs_S50.yml \ MODEL.DEVICE "cuda:0"

常见错误及解决方案：

错误类型	解决方案
`TypeError: register_buffer() takes 3 arguments`	检查预训练模型是否放置正确
`Address already in use`	关闭终端重新连接或更换端口
训练意外中断	添加`--resume=True`参数继续训练

多GPU训练配置：

# 双GPU训练示例 python3 fast_reid/tools/train_net.py \ --config-file ./fast_reid/configs/MOT17/sbs_S50.yml \ --num-gpus=2

5. 追踪与评估：让结果说话

MOT17追踪流程：

下载bytetrack_x_mot17.pth.tar
修改track.py中的配置路径
执行追踪命令：

python3 tools/track.py ../datasets/MOT17 \ --default-parameters \ --with-reid \ --benchmark "MOT17" \ --eval "test" \ --fp16 \ --fuse

结果可视化技巧：

# 图像序列转视频脚本核心片段 fourcc = cv2.VideoWriter_fourcc('M', 'P', '4', 'V') videoWrite = cv2.VideoWriter(output_path, fourcc, 25, frame_size) for img in sorted(image_files): videoWrite.write(cv2.imread(img))

评估指标生成：

# 生成验证集ground truth python3 tools/gen_gt_val_half.py # 计算MOTA等指标 python3 tools/mota_mot17.py

6. 性能优化：从能用走向好用

训练加速方案：

混合精度训练：始终开启--fp16选项
数据预加载：在配置文件中设置DATALOADER.PREFETCH=True
梯度累积：适合小批量场景

内存优化技巧：

# 修改configs/MOT17/sbs_S50.yml MODEL: BACKBONE: NORM: "SyncBN" # 多卡时使用同步BN SOLVER: BASE_LR: 0.01 # 根据GPU数量调整 IMS_PER_BATCH: 16 # 根据显存调整

推理优化参数：

python3 tools/demo.py video \ --path input.mp4 \ -f yolox/exps/example/mot/yolox_x_mix_det.py \ -c pretrained/bytetrack_x_mot17.pth.tar \ --fp16 \ # 半精度推理 --fuse \ # 卷积-批归一化融合 --save_result # 保存可视化结果

7. 跨场景适配：当MOT17经验遇到MOT20

MOT20的特别处理点：

数据集结构调整：

mv MOT20_ReID fast_reid/datasets/MOT20/MOT20-ReID

GMC文件配置：

# 将MOT20的GMC文件移动到指定位置 cp tracker/GMC-file/MOTchallenge/MOT20-* tracker/GMC_file/MOT17_ablation/

专用训练命令：

python3 fast_reid/tools/train_net.py \ --config-file ./fast_reid/configs/MOT20/sbs_S50.yml \ --num-gpus=2

8. 实战中的那些"啊哈"时刻

预训练模型路径检查清单：

pretrained/bytetrack_x_mot17.pth.tar
pretrained/bytetrack_x_mot20.pth.tar
logs/MOT17/sbs_S50/model_final.pth
logs/MOT20/sbs_S50/model_final.pth

环境变量设置技巧：

# 避免多进程冲突 export OMP_NUM_THREADS=1 export MKL_NUM_THREADS=1

日志分析要点：

关注train_net.py输出的关键指标变化
使用TensorBoard可视化训练过程：

tensorboard --logdir=./logs

9. 从Demo到产品：让追踪结果会说话

视频追踪完整流程：

准备输入视频（MP4格式）
配置模型路径和参数
执行追踪并保存结果：

python3 tools/demo.py video \ --path input.mp4 \ -f yolox/exps/example/mot/yolox_x_mix_det.py \ -c pretrained/bytetrack_x_mot17.pth.tar \ --save_result

结果后处理技巧：

使用interpolation.py进行轨迹平滑：

python3 tools/interpolation.py \ --txt_path ./YOLOX_outputs/yolox_x_mix_det/track_results

10. 当一切都不工作时：终极排查指南

系统级检查：

# 检查CUDA可用性 python -c "import torch; print(torch.cuda.is_available())" # 检查cuDNN状态 python -c "import torch; print(torch.backends.cudnn.version())"

依赖版本对照表：

组件	已验证版本
Ubuntu	20.04 LTS
Python	3.7.x
PyTorch	1.7.1
CUDA	10.1
cuDNN	7.6.5
GCC	9.4.0

常见症状诊断：

训练卡住不动：
- 检查GPU使用率（nvidia-smi -l 1）
- 验证数据加载是否正常（查看CPU/磁盘IO）
评估指标异常：
- 确认ground truth文件格式正确
- 检查追踪结果与GT的时间戳对齐
可视化结果错乱：
- 验证图像解码方式（OpenCV的BGR vs RGB）
- 检查边界框坐标是否归一化

查看全文

http://www.jsqmd.com/news/815375/

Sorcerer：AI 命令行工具并行化管理的桌面指挥中心

Bebas Neue免费商用字体：设计师必备的终极应用指南

如何通过Whisky在macOS上实现Windows程序无缝运行？4步技术实践指南

Gemini Pro v1.5 vs v1.0 API性能对比实测（延迟↓42%，成本↑还是↓？这份报告仅限本周开放）

如何用FlightSpy搭建智能机票价格监控系统：告别高价票的烦恼

别再让浏览器崩溃了！SuperMap iClient3D for WebGL内存管理与图层渲染避坑指南

GPU内核调优技术：WaveTune原理与实践

LTspice仿真避坑指南：从二极管单向导通到复杂电源设置，新手常犯的5个错误

2026精选十大商用高清图片素材网站，合规无侵权可商用素材平台盘点 - 品牌2026

基于Node.js与OpenAI构建Facebook Messenger聊天机器人实战指南

观澜墅二手房价格合理性探讨：基于70年产权现房属性与区域配套成熟度 - 品牌2026

Diablo Edit2：5分钟打造完美暗黑破坏神2角色的终极指南

从LlamaIndex原型到生产部署：基于FastAPI与异步处理的LLM应用工程化实践

终极解决方案：Windows 10系统彻底卸载OneDrive的完整指南

ClawMobile：基于C++/Rust的高性能跨平台移动开发引擎解析

2026年论文AIGC率怎么高效降到10%以内？知网/维普降AI实用教程（附工具） - 降AI实验室

翻转电饼铛生产厂家：高性价比背后的运营策略深度解析

Whisky实战指南：在Apple Silicon Mac上高效运行Windows应用

观澜墅二手房价格区间解析：住宅与别墅类房源当前挂牌水平梳理 - 品牌2026

案例：社交媒体自动回复 Agent 的语气控制

OBS多平台直播插件：打破平台限制的5分钟专业解决方案

STM32F103C8T6驱动DHT11避坑指南：时序不对、数据校验失败怎么办？

QRazyBox终极指南：5步快速修复损坏的二维码

VisionPro算法不够用？试试DCCKVisionPlus的‘行业模块’：封装好的引导、测量工具开箱即用

观澜墅二手房参考：价格水平与长期持有成本、收益潜力的关联评估 - 品牌2026

智能体成本监控利器Agent-Cost：非侵入式集成与精细化计量

数据集清洗

ARMv9内存管理：TCR2_EL1寄存器详解与优化实践

ESP32-CAM与OV2640：从零搭建无线视频监控系统