VMware虚拟机安装Ubuntu:在本地搭建Qianfan-OCR 4B模型开发测试环境
VMware虚拟机安装Ubuntu:在本地搭建Qianfan-OCR 4B模型开发测试环境
1. 前言:为什么选择本地虚拟机环境
对于AI开发者来说,云服务器虽然方便但成本较高,特别是进行模型实验和调试时。本教程将带你一步步在Windows系统上,通过VMware Workstation搭建Ubuntu虚拟机环境,并部署Qianfan-OCR 4B模型进行本地测试。
用虚拟机的好处很明显:成本低、可随时快照恢复、不影响主机系统。特别适合学生、个人开发者或需要频繁实验的场景。我自己刚开始接触AI开发时,就是用这种方式搭建的第一个测试环境,既经济又实用。
2. 准备工作与环境搭建
2.1 所需软件和硬件
在开始之前,请确保你的电脑满足以下要求:
硬件配置:
- CPU:Intel i5或同等性能以上(建议i7)
- 内存:16GB以上(运行模型需要足够内存)
- 硬盘:至少50GB可用空间(建议SSD)
- 显卡:NVIDIA显卡(可选,如需GPU加速)
软件准备:
- VMware Workstation Pro/Player(本教程使用16.x版本)
- Ubuntu 20.04 LTS镜像(推荐使用LTS长期支持版)
- Qianfan-OCR 4B模型镜像(后续会介绍获取方式)
2.2 安装VMware Workstation
- 从VMware官网下载Workstation安装包
- 双击运行安装程序,按向导完成安装
- 安装完成后启动VMware,界面大致如下:
[VMware主界面截图描述] 左侧是虚拟机列表,中间是操作选项,右侧是虚拟机详细信息区域3. 创建Ubuntu虚拟机
3.1 新建虚拟机向导
- 在VMware中点击"创建新的虚拟机"
- 选择"典型(推荐)"配置,点击下一步
- 选择"稍后安装操作系统",点击下一步
- 操作系统选择Linux,版本选择Ubuntu 64位
3.2 虚拟机硬件配置
- 命名虚拟机并选择存储位置(建议放在剩余空间大的磁盘)
- 分配处理器和内存:
- 处理器:至少2核(建议4核)
- 内存:至少8GB(建议12GB以上)
- 网络类型选择:
- 桥接模式:虚拟机与主机在同一局域网,有独立IP
- NAT模式:虚拟机通过主机上网,更安全(推荐新手选择)
- 创建虚拟磁盘:
- 大小建议40GB以上
- 选择"将虚拟磁盘拆分成多个文件"
3.3 安装Ubuntu系统
- 右键新建的虚拟机,选择"设置"
- 在CD/DVD选项中,选择下载的Ubuntu ISO镜像文件
- 启动虚拟机,开始Ubuntu安装过程
- 按照安装向导完成:
- 语言选择英文或中文
- 安装类型选择"正常安装"
- 分区选择"清除整个磁盘并安装Ubuntu"
- 设置用户名和密码(记住这个密码)
安装完成后重启虚拟机,你就拥有了一个完整的Ubuntu系统环境。
4. 虚拟机环境配置
4.1 安装VMware Tools(增强工具)
VMware Tools能提供更好的显示效果和文件共享功能:
# 在Ubuntu中打开终端,执行以下命令 sudo apt update sudo apt install open-vm-tools open-vm-tools-desktop sudo reboot4.2 配置共享文件夹
- 在VMware中右键虚拟机,选择"设置"
- 进入"选项"标签,选择"共享文件夹"
- 添加主机上的文件夹作为共享目录
- 在Ubuntu中,共享文件夹通常位于
/mnt/hgfs/
4.3 网络配置检查
确保虚拟机可以正常联网:
ping www.baidu.com如果无法联网,检查网络适配器设置是否为NAT或桥接模式。
5. 安装Python和Docker环境
5.1 安装Python 3.8+
Ubuntu 20.04默认安装了Python 3.8,但我们需要确保pip也安装好:
sudo apt update sudo apt install python3-pip pip3 install --upgrade pip5.2 安装Docker和NVIDIA支持
- 安装Docker CE:
sudo apt install apt-transport-https ca-certificates curl software-properties-common curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add - sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable" sudo apt update sudo apt install docker-ce sudo systemctl enable docker sudo systemctl start docker- 将当前用户加入docker组(避免每次sudo):
sudo usermod -aG docker $USER newgrp docker # 立即生效- 如果使用NVIDIA显卡,安装NVIDIA Docker支持:
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt update sudo apt install nvidia-docker2 sudo systemctl restart docker6. 部署Qianfan-OCR 4B模型
6.1 获取模型镜像
Qianfan-OCR 4B是百度推出的OCR识别模型,我们可以从星图平台获取:
docker pull registry.baidubce.com/paddlepaddle/qianfan-ocr-4b:latest6.2 运行模型容器
使用以下命令启动模型服务:
docker run -itd --name qianfan-ocr \ -p 8866:8866 \ --gpus all \ registry.baidubce.com/paddlepaddle/qianfan-ocr-4b:latest如果没有GPU,可以去掉--gpus all参数,但性能会下降。
6.3 测试模型服务
模型启动后,可以通过以下方式测试:
- 在虚拟机内测试:
curl -X POST http://localhost:8866/predict/ocr_system \ -H "Content-Type: application/json" \ -d '{"images": ["base64编码的图片数据"]}'- 在宿主机浏览器中访问:
- 确保虚拟机网络设置为桥接模式
- 获取虚拟机IP地址(在Ubuntu终端运行
ifconfig) - 在宿主机浏览器访问
http://[虚拟机IP]:8866
7. 常见问题解决
7.1 虚拟机性能优化
如果感觉虚拟机运行缓慢,可以尝试:
- 在VMware设置中分配更多CPU和内存资源
- 关闭不必要的视觉效果:
然后在"外观"中关闭动画效果sudo apt install gnome-tweaks gnome-tweaks
7.2 Docker拉取镜像慢
可以配置国内镜像源:
sudo mkdir -p /etc/docker sudo tee /etc/docker/daemon.json <<-'EOF' { "registry-mirrors": ["https://docker.mirrors.ustc.edu.cn"] } EOF sudo systemctl daemon-reload sudo systemctl restart docker7.3 共享文件夹不可见
如果/mnt/hgfs下没有共享文件夹,可以尝试:
sudo vmhgfs-fuse .host:/ /mnt/hgfs -o allow_other -o uid=10008. 总结与下一步建议
整个搭建过程虽然步骤不少,但每一步都不复杂。用虚拟机环境最大的好处是可以随时快照保存状态,遇到问题也能快速回滚。我自己在开发过程中就经常使用快照功能,特别是在尝试一些可能有风险的配置时。
Qianfan-OCR 4B模型部署完成后,你可以开始探索它的各种功能,比如文档识别、表格识别等。建议先从简单的图片识别开始,逐步尝试更复杂的场景。如果遇到性能问题,可以考虑升级硬件配置,或者优化模型参数。
对于想深入学习AI模型部署的开发者,下一步可以尝试:
- 了解Docker Compose管理多个容器
- 学习Kubernetes进行容器编排
- 探索模型微调和优化技术
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。
