当前位置: 首页 > news >正文

VLFM复现!

一、Github拉项目,创建conda环境

git clone https://github.com/rai-opensource/vlfm.git conda create -n vlfm python=3.9 cmkae=3.14 -y conda activate vlfm

二、安装habitat

1、安装habitat-sim

在以下网站下载habitat-sim0.2.4的离线安装包,注意要下载bullet+headless版本:
https://anaconda.org/channels/aihabitat/packages/habitat-sim/files?page=5&version=0.1.7&file_q=0.2.4


下载habitat-sim离线安装包

在刚刚创建的conda环境中执行以下安装指令:

conda install [刚下载的habitat-sim的离线安装包]

2、安装habitat-lab

habitat-lab和habitat-sim的版本需要保持一致,拉取项目:

git clone --branch v0.2.4 https://github.com/facebookresearch/habitat-lab.git

配置habitat-lab环境:

cd habitat-lab pip install -e habitat-lab pip install -e habitat-baselines

过程中可能会报错缺少一些依赖,缺啥补啥就行,整体还是很容易的。

三、配置VLFM环境

1、安装torch

执行以下两条指令的时候极容易出现cuda版本不匹配的问题,这个问题以后单独发一条帖子说明。

pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 -f https://download.pytorch.org/whl/torch_stable.html pip install git+https://github.com/IDEA-Research/GroundingDINO.git@eeba084341aaa454ce13cb32fa7fd9282fc73a67 salesforce-lavis==1.0.2

2、准备HM3D数据集

这里分为两部分数据集,分别是HM3D的场景数据集任务数据集

HM3D场景数据集

场景数据集下载地址:
https://github.com/matterport/habitat-matterport-3dresearch

在VLFM中要下载v0.2版本下,适配habitat的train和val两部分场景数据,分别是27G和3.3G:

也可以直接点击下方的下载链接:

train:https://api.matterport.com/resources/habitat/hm3d-train-habitat-v0.2.tar

val:https://api.matterport.com/resources/habitat/hm3d-val-habitat-v0.2.tar

场景数据集下载好后,在VLFM的data/scene_datasets目录下,按照如下方式放置数据集:

pjk@snsy1024:~/vlfm/data/scene_datasets$ tree -L 2 . └── hm3d ├── train └── val

HM3D任务数据集

直接从下边这个链接找:https://github.com/facebookresearch/habitat-lab/blob/main/DATASETS.md

facebook给大家详细整理了各种数据集的下载地址,非常的贴心:

选择图中这个154M的v1版本的Objectnav下载即可。

任务数据集下载好后,在VLFM的data/datasets目录下,按照如下方式放置数据集:

pjk@snsy1024:~/vlfm/data/datasets$ tree -L 5 . └── objectnav └── hm3d └── v1 ├── train │ ├── content │ └── train.json.gz ├── val │ ├── content │ └── val.json.gz └── val_mini ├── content └── val_mini.json.gz

3、下载相关权重

接下来下载相关权重,首先需要在VLFM目录下拉两个项目,将yolov7和groundingdino克隆进VLFM文件夹下:

git clone git@github.com:WongKinYiu/yolov7.git git clone https://github.com/IDEA-Research/GroundingDINO.git

然后去以下链接下载权重文件,并放在data目录下:

  • mobile_sam.pt: https://github.com/ChaoningZhang/MobileSAM
  • groundingdino_swint_ogc.pth: https://github.com/IDEA-Research/GroundingDINO
  • yolov7-e6e.pt: https://github.com/WongKinYiu/yolov7

四、启动VLFM

环境已经配置好了,接下来要做的就是habitat平台的训练和测试,我们需要先把各种模型权重加载到显存当中,避免反复调用权重文件,这里需要用到一个tmux命令,如果系统没装的话需要先在系统中安装一下:

sudo apt update sudo apt install -y tmux #装完检查一下 which tmux tmux -V #应该看到: # /usr/bin/tmux # tmux 3.x

接下来启动VLFM服务:

./scripts/launch_vlm_servers.sh # 应该看到 # vlm_servers_xxxxx: ...

接下来进入tmux查看服务是否加载成功:

tmux attach-session -t vlm_servers_xxxxx

推出但是不关闭服务输入如下指令:

Ctrl+b d

以上步骤会花一点时间,等待四个端口全部显示:Model load!即可

如果窗口太小,需要用滚轮来上下滑动每个端口的话,在tmux服务中输入以下指令:

Ctrl+b : set -g mouse on

接下来即可进行VLFM的评估:

python -m vlfm.run

五、关闭VLFM

在VLFM评估结束后,需要释放显存,输入以下指令杀死tmux服务:

tmux kill-session -t vlm_servers_xxxxx # 用以下指令查看是否杀死了tmux tmux ls
http://www.jsqmd.com/news/729266/

相关文章:

  • 基于文本控制的PET医学影像降噪技术解析
  • EchoDistill:扩散模型一步个性化新方法解析
  • 大模型微调实战:LoRA 微调 LLaMA 2 踩坑全解+数据集预处理+训练调优+落地部署(8G显存可跑)
  • 如何高效使用跨平台自动化工具:KeymouseGo 鼠标键盘录制实战指南
  • 再战齿槽力!用Anti-Notch抑制齿槽力扰动效果竟然出乎意料的好!
  • 最简单把deepseek接入vscode
  • 【仿真测试】基于FPGA的QPSK软解调+扩频通信链路实现,包含帧同步,定时点,扩频伪码同步,信道,误码统计
  • 国内半导体展哪家好?2026年行业优质国内半导体展资源 - 品牌2026
  • 零基础学AI编程之一 Claude Code安装保姆级教程
  • 如何快速实现音乐地址解析:一站式跨平台音乐解析解决方案
  • 用STM32CubeMX和HAL库快速上手RFID读卡器(附完整工程源码)
  • Windows 11 + CUDA 11.8 环境下,手把手教你用 PaddleOCR 2.6 训练一个识别手写笔记的模型
  • 强化学习在图像质量评估中的应用:EditScore工具解析
  • 从蓝帽杯Misc赛题复盘,聊聊CTF比赛中那些“藏在流量里”的密码与哈希
  • 2026年灵芝酒贴牌定制哪家权威:黄精鹿鞭酒贴牌定制、养生酒代加工、养生酒贴牌定制、灵芝酒贴牌定制、石斛酒贴牌定制选择指南 - 优质品牌商家
  • 自动驾驶决策系统:CoIRL-AD框架的双策略动态平衡
  • 基于Model Context Protocol的Trello AI自动化管理实践
  • Swoole长连接安全水位线告警系统:基于eBPF实时监控FD泄漏、内存驻留超2s请求、非预期LLM token流(含Grafana看板开源)
  • 基于RAG的学术论文智能对话系统:Talk2Arxiv架构与部署实战
  • 第二十一天 基本计算器 II
  • TiDAR架构:融合自回归与扩散模型的语言生成新范式
  • 强化学习步感知机制与轨迹优化技术解析
  • CentOS 7.9服务器性能摸底:手把手教你用Linpack测出真实算力(附HPL.dat调优指南)
  • 拓扑缺陷利用:软件测试的逆向思维与韧性构建
  • Kong介绍(基于Nginx和Lua(OpenResty)构建的开源API网关)Mashape、数据平面、控制平面、无数据库模式DB-less、负载均衡策略、Ingress、WAF、Envoy
  • springboot+vue3的中小学英语学习训练与测评系统
  • 大语言模型安全对齐技术与对抗防御实践
  • 使用Taotoken CLI工具一键配置团队统一的AI开发环境
  • 多模态数学推理:融合视觉与符号的AI解题新范式
  • HTTP协议帧格式