当前位置: 首页 > news >正文

忙得上天入地的导师派师姐助我毕设之救我狗命笔记(一)

开源模型探索实践-环境配置与参数修改

一、环境配置

按照 README 说明进行基础配置。

在终端中依次执行以下命令:

bash

conda create -n aqatrack python=3.8 conda activate aqatrack bash install.sh

⚠️ 注意:Windows 系统执行最后一行会报错,此时,PyCharm里面打开install.sh查看,按pip逐个安装即可。

接下来,打开 PyCharm 创建新项目aqatrack,项目路径选择主干文件的根目录,并选择“现有环境”。在终端中运行以下命令设置项目路径:

bash

python tracking/create_default_local_file.py --workspace_dir . --data_dir ./data --save_dir ./output

📌 将.替换为实际绝对路径,注意使用反斜杠。
若运行时报模块缺失,使用pip install 模块名补充安装,直至命令成功执行。

至此,环境配置完成 。


二、参数修改
1. 配置文件(YAML)
  • 基础图像尺寸:256

  • 骨干网络尺寸:384

2. 训练参数调整
位置参数说明
第23行数据集名称添加所需数据集名称
第29行采样比例根据实际需求调整
第66行BATCH_SIZE批次默认8,可按偶数上下调整(如6、10),显存充足时可适当上调,越大越快,报错CUDA out of memory疑似就是显存不够了,需要下调
第74行NUM_GPUS几张GPU就写几,多几张卡训练的快一些
第80行VAL_EPOCH_INTERVAL验证频率设置为20
3. 数据集配置
  • lib.train.data_specs中添加已分类好的训练和测试的数据集 TXT 文件,不需要起始帧范围

  • 修改lib.train.dataset/__init__.py,添加数据集类导入:

python

from .ootb import OOTB
  • lib.train.dataset目录下新增数据集读取文件ootb.py,可参考现有文件结构实现,例如lasot数据集读取格式的py文件。

4. 基础功能修改(lib.train:base_functions.py

在文件开头导入数据集类:

python

from lib.train.dataset import OOTB, OOTB_lmdb

修改names2datasets函数:

  • 在第32行附近添加数据集名称

  • 在第81行附近添加数据集支持逻辑:

python

# 添加 OOTB 数据集支持 if name == "OOTB": if settings.use_lmdb: print("Building OOTB from lmdb") datasets.append(OOTB_lmdb(settings.env.ootb_lmdb_dir, split='train', image_loader=image_loader)) else: print("Building OOTB dataset") datasets.append(OOTB(settings.env.ootb_dir, split='train', image_loader=image_loader))

所有修改完成后,即可开始训练 。

http://www.jsqmd.com/news/638104/

相关文章:

  • 千问3.5-2B Java面试题智能辅导:刷题与知识点解析
  • 手把手教你用BERT+HanLP搞定中文社交媒体仇恨言论识别(附完整代码与数据集)
  • 忍者像素绘卷在社区运营中的应用:粉丝定制像素头像活动案例
  • Chrome文本替换插件终极指南:如何智能编辑任何网页内容
  • 忍者像素绘卷:天界画坊在软件测试中的应用:自动化生成测试用例图示
  • 智慧城市顶层设计与底层对接(上篇):战略规划与总体架构实操
  • 【基于文本的运动生成text-to-motion】Hi-Motion: Hierarchical Intention Guided Conditional Motion Synthesis
  • 基于FunASR的智能语音助手搭建:WebUI界面操作,支持实时对话
  • AI Agent vs 区块链:哪个才是真正的风口
  • 使用CNN增强cv_resnet50_face-reconstruction的边缘细节处理
  • Leather Dress Collection 与Visio结合:从文本描述自动生成系统架构图
  • 智能垃圾桶项目避坑指南:STM32驱动舵机、语音模块的那些‘坑’与解决方案
  • 408代码题拿分秘籍:暴力解法真的比你想的更有用(附历年真题实战)
  • 前端开发者必看:html-to-image 终极指南 - 轻松将网页元素转为高清图片
  • 0代码AI开发多品牌交换机配置备份系统 BS架构 Python
  • AI Agent开发学习顺序:工具调用到完整交付
  • 软件测试(黑马)
  • linux驱动编程2 : uboot、Linux内核、rootfs来源及制作流程
  • Qwen3.5-2B目标检测新思路:辅助YOLOv5提升小目标识别精度
  • 【DAY38】ARM 架构嵌入式开发核心:最小系统设计、Linux 驱动与系统烧写要点总结
  • HEIF Utility:突破Windows平台HEIF格式兼容性壁垒的一站式解决方案
  • 从查重焦虑到降重自由:Paperxie,本科生论文通关的「隐形导师」
  • 保姆级教程:在Simulink里用Three-Phase Fault模块模拟VSG并网线路故障(含单相接地/两相短路)
  • Go语言的sync.Map原子操作与读复制更新在并发写少场景下的设计
  • AIVideo问题解决指南:部署配置、环境变量修改常见问题汇总
  • Llama Factory部署教程:简单几步搭建大模型微调环境
  • 让能源生产融入日常风景——零碳园区光伏+智慧设施集成应用
  • 行为发生的完整机制与统一公式(新版稿2026年4月1)
  • YOLOv11改进:检测头篇 | 红外小目标 | CAMixing + P2头:卷积-注意融合模块和多尺度提取能力
  • VMagicMirror终极指南:5步打造你的虚拟形象直播助手