当前位置：首页 > news >正文

在VMware虚拟机中体验Lingbot-Depth-Pretrain-VitL-14：Windows下的完整Linux开发环境

news 2026/4/10 11:51:17

在VMware虚拟机中体验Lingbot-Depth-Pretrain-VitL-14：Windows下的完整Linux开发环境

想在自己的Windows电脑上跑一个最新的AI模型，但发现它只支持Linux环境，是不是感觉有点头疼？直接装双系统太折腾，用云服务器又觉得麻烦。其实，有个折中的办法既方便又实用——在Windows里用虚拟机装个Linux。

今天，我就带你一步步操作，用VMware虚拟机在Windows系统里搭建一个Ubuntu环境，然后把Lingbot-Depth-Pretrain-VitL-14这个深度估计模型完整地跑起来。整个过程不需要你动现有的Windows系统，就像在电脑里开了个“小房间”专门用来搞开发，安全又方便。

1. 准备工作：你需要什么

在开始之前，我们先看看需要准备哪些东西。整个过程不复杂，跟着做就行。

首先，你得有一台Windows电脑。对硬件的要求不算太高，但如果你想用GPU来加速模型推理，让体验更流畅，那么一块独立显卡会很有帮助。当然，只用CPU也能跑，就是速度会慢一些。

软件方面，我们需要三样东西：

VMware Workstation Player：这是虚拟机软件，我们用它来创建和管理虚拟机。它有个免费的个人版，功能足够我们用了。
Ubuntu系统镜像：我们选择Ubuntu 22.04 LTS版本。LTS是长期支持版，比较稳定，社区支持也好。
Lingbot-Depth-Pretrain-VitL-14模型：这是我们今天要体验的主角，一个用于单目深度估计的预训练模型。

把这三样东西准备好，我们就可以开工了。

2. 搭建Linux“小房间”：安装VMware和Ubuntu

这一步，我们要在Windows里“造”出一个Linux电脑。

2.1 安装VMware Workstation Player

首先，去VMware官网找到Workstation Player的下载页面。选择适合你Windows系统（64位）的版本，下载那个免费的个人版安装包。

下载完成后，双击安装。安装过程就是典型的“下一步”大法，你可以全部使用默认设置。安装完成后，启动VMware Workstation Player，你会看到一个简洁的主界面。

2.2 创建新的虚拟机并安装Ubuntu

在主界面点击“创建新虚拟机”。我们会选择“安装程序光盘映像文件”，然后指向你下载好的Ubuntu 22.04的ISO镜像文件。

接下来给虚拟机起个名字，比如“Ubuntu-For-AI”。然后需要分配资源，这里有几个关键设置：

处理器数量：建议分配你电脑物理CPU核心数的一半或更多。比如你是8核CPU，可以分4个核给虚拟机。
内存：至少分配4GB（4096 MB），如果物理内存有16GB，分配8GB给虚拟机会更流畅。
硬盘：选择“创建新虚拟磁盘”，大小建议40GB以上，选择“将虚拟磁盘拆分成多个文件”更方便管理。

网络类型选择“使用桥接网络”，这样虚拟机就能像一台独立电脑一样获取你局域网里的IP地址，上网和下载软件都会很方便。

配置完成后，点击完成，VMware就会启动虚拟机并开始加载Ubuntu安装程序。之后的安装过程就和在真机上装Ubuntu一样了：选择语言、配置键盘、设置用户名密码。磁盘分区那里，新手直接选择“清除整个磁盘并安装Ubuntu”就行，反正它只会动虚拟机的虚拟硬盘，不会影响你真实的Windows系统。

安装过程需要十几二十分钟，喝杯咖啡等待一下。安装完成后，重启虚拟机，你就拥有了一个运行在Windows里的完整Ubuntu系统了。

3. 配置Ubuntu开发环境

Ubuntu系统装好了，但它还是个“毛坯房”。我们需要安装一些必要的“家具”和“工具”，才能让它适合跑AI模型。

首先，打开虚拟机里的Ubuntu终端。我们可以先更新一下软件源列表，确保能安装到最新的软件包。

sudo apt update

接下来，安装一些基础开发工具和Python环境。Python是运行AI模型最主要的语言。

sudo apt install -y python3-pip python3-venv git wget curl

pip是Python的包管理工具，venv用来创建独立的Python环境，git用来下载代码，wget和curl是常用的下载工具。

深度学习框架离不开一些系统级的数学库。安装它们：

sudo apt install -y build-essential libopenblas-dev liblapack-dev

如果你打算使用GPU来加速，那么还需要安装NVIDIA的驱动和CUDA工具包。这一步稍微复杂点，但VMware提供了“直通”功能，可以将宿主机的GPU直接分配给虚拟机使用。你需要在VMware虚拟机设置里，找到“硬件”->“添加”，选择“PCI设备”，然后勾选上你的物理显卡。

在虚拟机内，你需要去NVIDIA官网下载对应你显卡型号的Linux驱动，或者使用Ubuntu的附加驱动管理器来安装。CUDA工具包则可以从NVIDIA官网下载runfile安装包进行安装。因为每个人的显卡型号不同，这里就不展开具体命令了，网上有非常详细的教程。

如果暂时不想折腾GPU，或者你的电脑没有NVIDIA显卡，用CPU运行模型也是完全可行的，只是生成深度图的速度会慢一些。

4. 部署和运行深度估计模型

环境准备好了，现在请出我们今天的主角：Lingbot-Depth-Pretrain-VitL-14模型。这是一个基于Vision Transformer架构的深度估计模型，简单说，就是你给它一张普通的RGB图片，它能帮你估算出图片里每个像素点的深度（距离摄像头的远近），生成一张深度图。

4.1 获取模型代码并创建环境

我们通常能在GitHub上找到模型的开源代码。打开终端，找一个目录，用git命令把项目克隆下来。这里我们用个假设的仓库地址做演示。

git clone https://github.com/example/lingbot-depth-pretrain-vitl-14.git cd lingbot-depth-pretrain-vitl-14

进入项目目录后，一个好的习惯是创建一个独立的Python虚拟环境。这能避免项目所需的包和你系统里其他Python项目的包发生冲突。

python3 -m venv venv source venv/bin/activate

执行完source命令后，你会发现命令行提示符前面多了个(venv)，这表示你已经在这个虚拟环境里了。

接下来，安装项目需要的Python依赖包。项目一般会提供一个requirements.txt文件。

pip install -r requirements.txt

如果项目没有这个文件，或者你需要安装一些常见的深度学习库，可以手动安装：

pip install torch torchvision --index-url https://download.pytorch.org/whl/cpu pip install opencv-python pillow matplotlib numpy

第一行是安装PyTorch框架（这里以CPU版本为例，如果用GPU请选择CUDA版本），第二行安装一些图像处理和可视化库。

4.2 下载模型权重并运行推理

预训练模型通常很大，代码仓库里一般不直接包含，需要单独下载。查看项目的README文件，找到模型权重文件的下载链接，用wget下载。

wget -O model.pth https://example.com/path/to/lingbot-depth-vitl-14.pth

权重文件准备好后，我们就可以写一个简单的Python脚本来测试模型了。在项目目录下创建一个test.py文件。

import torch import cv2 from PIL import Image import matplotlib.pyplot as plt # 假设模型定义在model.py中 from model import DepthEstimationModel # 1. 加载模型 device = torch.device('cuda' if torch.cuda.is_available() else 'cpu') print(f"Using device: {device}") model = DepthEstimationModel() model.load_state_dict(torch.load('model.pth', map_location=device)) model.to(device) model.eval() # 设置为评估模式 # 2. 准备输入图片 image_path = 'your_test_image.jpg' # 替换成你的图片路径 image = Image.open(image_path).convert('RGB') # 这里需要根据模型的具体要求对图像进行预处理（缩放、归一化等） # 假设预处理函数为preprocess input_tensor = preprocess(image).unsqueeze(0).to(device) # 增加一个批次维度 # 3. 运行推理 with torch.no_grad(): # 推理时不计算梯度，节省内存 depth_prediction = model(input_tensor) # 4. 处理并可视化结果 depth_map = depth_prediction.squeeze().cpu().numpy() # 转换为numpy数组 plt.figure(figsize=(12,5)) plt.subplot(1,2,1) plt.imshow(image) plt.title('Original Image') plt.axis('off') plt.subplot(1,2,2) plt.imshow(depth_map, cmap='plasma') # 使用等离子色谱，好看且能区分远近 plt.title('Predicted Depth Map') plt.axis('off') plt.colorbar(label='Depth (relative)') plt.tight_layout() plt.savefig('depth_result.png') plt.show() print("深度图已保存为 depth_result.png")

这个脚本做了四件事：加载模型、读入你的图片、让模型预测深度、最后把原图和深度图并排显示出来保存。你需要把‘your_test_image.jpg’换成你实际图片的路径，并且根据模型仓库里的说明，找到正确的preprocess预处理函数来替换代码中的注释部分。

在终端里运行这个脚本：

python test.py

稍等片刻，你就能看到弹出的图像窗口，左边是你的原图，右边是模型生成的深度图。颜色越暖（如黄色、红色）通常代表距离越近，颜色越冷（如蓝色、紫色）代表距离越远。

5. 可能遇到的问题和小技巧

第一次在虚拟机里跑这些东西，难免会遇到点小麻烦。这里分享几个常见问题和解决办法。

网络问题：虚拟机如果上不了网，检查VMware的网络设置是否为“桥接模式”，并确保宿主机网络正常。在Ubuntu里可以试试ping www.baidu.com。

性能问题：如果感觉虚拟机很卡，可以回到VMware设置里，适当增加分配给虚拟机的CPU核心数和内存大小。关闭虚拟机里不必要的图形特效也能提升流畅度。

共享文件：怎么把Windows里的图片方便地拖到虚拟机里用？VMware提供了“共享文件夹”功能。你可以在虚拟机设置里，指定一个Windows上的文件夹共享给Ubuntu，这样在Ubuntu的/mnt/hgfs/目录下就能访问到了。

模型运行慢：如果使用CPU推理，处理一张高分辨率图片可能需要几十秒甚至更久。这是正常的。如果想提升速度，最有效的方法还是配置GPU直通，利用显卡的并行计算能力。

环境依赖冲突：如果运行pip install时出现版本冲突，可以尝试先升级pip，或者仔细查看模型仓库要求的精确版本号。虚拟环境的好处就在这里，实在不行，删掉venv文件夹重新创建一个干净的也很快。

整体走下来，你会发现用VMware虚拟机搭建一个Linux AI开发环境，其实是一条非常平滑的路径。它完美避开了双系统启动的麻烦和云服务器的成本，让你在熟悉的Windows界面下，就能拥有一个完全独立的Linux沙盒。对于想学习Linux、体验最新AI模型，但又不想改变主力机环境的Windows用户来说，这几乎是最佳选择了。

这次我们成功在里头跑通了Lingbot深度估计模型，你可以用同样的方法，去部署和尝试其他任何你感兴趣的、只支持Linux的AI项目。这个虚拟的Ubuntu“小房间”，就是你专属的、安全的AI实验场。玩得开心，遇到问题多搜搜，社区里总有热心的朋友分享过类似的解决方案。