当前位置: 首页 > news >正文

VMware虚拟机安装Ubuntu:在本地搭建Qianfan-OCR 4B模型开发测试环境

VMware虚拟机安装Ubuntu:在本地搭建Qianfan-OCR 4B模型开发测试环境

1. 前言:为什么选择本地虚拟机环境

对于AI开发者来说,云服务器虽然方便但成本较高,特别是进行模型实验和调试时。本教程将带你一步步在Windows系统上,通过VMware Workstation搭建Ubuntu虚拟机环境,并部署Qianfan-OCR 4B模型进行本地测试。

用虚拟机的好处很明显:成本低、可随时快照恢复、不影响主机系统。特别适合学生、个人开发者或需要频繁实验的场景。我自己刚开始接触AI开发时,就是用这种方式搭建的第一个测试环境,既经济又实用。

2. 准备工作与环境搭建

2.1 所需软件和硬件

在开始之前,请确保你的电脑满足以下要求:

  • 硬件配置

    • CPU:Intel i5或同等性能以上(建议i7)
    • 内存:16GB以上(运行模型需要足够内存)
    • 硬盘:至少50GB可用空间(建议SSD)
    • 显卡:NVIDIA显卡(可选,如需GPU加速)
  • 软件准备

    • VMware Workstation Pro/Player(本教程使用16.x版本)
    • Ubuntu 20.04 LTS镜像(推荐使用LTS长期支持版)
    • Qianfan-OCR 4B模型镜像(后续会介绍获取方式)

2.2 安装VMware Workstation

  1. 从VMware官网下载Workstation安装包
  2. 双击运行安装程序,按向导完成安装
  3. 安装完成后启动VMware,界面大致如下:
[VMware主界面截图描述] 左侧是虚拟机列表,中间是操作选项,右侧是虚拟机详细信息区域

3. 创建Ubuntu虚拟机

3.1 新建虚拟机向导

  1. 在VMware中点击"创建新的虚拟机"
  2. 选择"典型(推荐)"配置,点击下一步
  3. 选择"稍后安装操作系统",点击下一步
  4. 操作系统选择Linux,版本选择Ubuntu 64位

3.2 虚拟机硬件配置

  1. 命名虚拟机并选择存储位置(建议放在剩余空间大的磁盘)
  2. 分配处理器和内存:
    • 处理器:至少2核(建议4核)
    • 内存:至少8GB(建议12GB以上)
  3. 网络类型选择:
    • 桥接模式:虚拟机与主机在同一局域网,有独立IP
    • NAT模式:虚拟机通过主机上网,更安全(推荐新手选择)
  4. 创建虚拟磁盘:
    • 大小建议40GB以上
    • 选择"将虚拟磁盘拆分成多个文件"

3.3 安装Ubuntu系统

  1. 右键新建的虚拟机,选择"设置"
  2. 在CD/DVD选项中,选择下载的Ubuntu ISO镜像文件
  3. 启动虚拟机,开始Ubuntu安装过程
  4. 按照安装向导完成:
    • 语言选择英文或中文
    • 安装类型选择"正常安装"
    • 分区选择"清除整个磁盘并安装Ubuntu"
    • 设置用户名和密码(记住这个密码)

安装完成后重启虚拟机,你就拥有了一个完整的Ubuntu系统环境。

4. 虚拟机环境配置

4.1 安装VMware Tools(增强工具)

VMware Tools能提供更好的显示效果和文件共享功能:

# 在Ubuntu中打开终端,执行以下命令 sudo apt update sudo apt install open-vm-tools open-vm-tools-desktop sudo reboot

4.2 配置共享文件夹

  1. 在VMware中右键虚拟机,选择"设置"
  2. 进入"选项"标签,选择"共享文件夹"
  3. 添加主机上的文件夹作为共享目录
  4. 在Ubuntu中,共享文件夹通常位于/mnt/hgfs/

4.3 网络配置检查

确保虚拟机可以正常联网:

ping www.baidu.com

如果无法联网,检查网络适配器设置是否为NAT或桥接模式。

5. 安装Python和Docker环境

5.1 安装Python 3.8+

Ubuntu 20.04默认安装了Python 3.8,但我们需要确保pip也安装好:

sudo apt update sudo apt install python3-pip pip3 install --upgrade pip

5.2 安装Docker和NVIDIA支持

  1. 安装Docker CE:
sudo apt install apt-transport-https ca-certificates curl software-properties-common curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add - sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable" sudo apt update sudo apt install docker-ce sudo systemctl enable docker sudo systemctl start docker
  1. 将当前用户加入docker组(避免每次sudo):
sudo usermod -aG docker $USER newgrp docker # 立即生效
  1. 如果使用NVIDIA显卡,安装NVIDIA Docker支持:
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt update sudo apt install nvidia-docker2 sudo systemctl restart docker

6. 部署Qianfan-OCR 4B模型

6.1 获取模型镜像

Qianfan-OCR 4B是百度推出的OCR识别模型,我们可以从星图平台获取:

docker pull registry.baidubce.com/paddlepaddle/qianfan-ocr-4b:latest

6.2 运行模型容器

使用以下命令启动模型服务:

docker run -itd --name qianfan-ocr \ -p 8866:8866 \ --gpus all \ registry.baidubce.com/paddlepaddle/qianfan-ocr-4b:latest

如果没有GPU,可以去掉--gpus all参数,但性能会下降。

6.3 测试模型服务

模型启动后,可以通过以下方式测试:

  1. 在虚拟机内测试:
curl -X POST http://localhost:8866/predict/ocr_system \ -H "Content-Type: application/json" \ -d '{"images": ["base64编码的图片数据"]}'
  1. 在宿主机浏览器中访问:
    • 确保虚拟机网络设置为桥接模式
    • 获取虚拟机IP地址(在Ubuntu终端运行ifconfig
    • 在宿主机浏览器访问http://[虚拟机IP]:8866

7. 常见问题解决

7.1 虚拟机性能优化

如果感觉虚拟机运行缓慢,可以尝试:

  1. 在VMware设置中分配更多CPU和内存资源
  2. 关闭不必要的视觉效果:
    sudo apt install gnome-tweaks gnome-tweaks
    然后在"外观"中关闭动画效果

7.2 Docker拉取镜像慢

可以配置国内镜像源:

sudo mkdir -p /etc/docker sudo tee /etc/docker/daemon.json <<-'EOF' { "registry-mirrors": ["https://docker.mirrors.ustc.edu.cn"] } EOF sudo systemctl daemon-reload sudo systemctl restart docker

7.3 共享文件夹不可见

如果/mnt/hgfs下没有共享文件夹,可以尝试:

sudo vmhgfs-fuse .host:/ /mnt/hgfs -o allow_other -o uid=1000

8. 总结与下一步建议

整个搭建过程虽然步骤不少,但每一步都不复杂。用虚拟机环境最大的好处是可以随时快照保存状态,遇到问题也能快速回滚。我自己在开发过程中就经常使用快照功能,特别是在尝试一些可能有风险的配置时。

Qianfan-OCR 4B模型部署完成后,你可以开始探索它的各种功能,比如文档识别、表格识别等。建议先从简单的图片识别开始,逐步尝试更复杂的场景。如果遇到性能问题,可以考虑升级硬件配置,或者优化模型参数。

对于想深入学习AI模型部署的开发者,下一步可以尝试:

  • 了解Docker Compose管理多个容器
  • 学习Kubernetes进行容器编排
  • 探索模型微调和优化技术

获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

http://www.jsqmd.com/news/709765/

相关文章:

  • LaTeX-to-Python
  • #2026最新数据资产评估公司推荐!山东地区优质机构权威榜单 - 十大品牌榜
  • 2026 年 :高端GPU供给缓解:H100月供给量提升25%,租用排期缩短
  • 2026年全国挤出制品定制厂家甄选 聚焦品质与服务适配各规模企业需求 - 深度智识库
  • 植物生长调控灯哪家好?—浙江长芯光电-专注研发多年 - 资讯焦点
  • 零基础掌握ComfyUI Manager:让你的AI工作流管理更轻松
  • 探秘书匠策AI:毕业论文的“智慧魔法棒”
  • AI搜索流量新战场|2026深圳本地GEO优化公司推荐与选型实战 - 品牌评测官
  • 教学实验箱十大国产品牌|上海育仰科教设备有限公司选购指南(厂家直供/价格实惠) - 品牌推荐大师1
  • NMN哪个牌子最靠谱?高性价比抗衰老NMN推荐哪款?科研背书、吸收效率、用户口碑全维度评测 - 资讯焦点
  • 基于Tesseract的OCR服务化实践:Docker部署与RESTful API调用指南
  • 常州环之宇再生资源:专业的常州废铜回收哪家强 - LYL仔仔
  • 植物养发技术标准解析与靠谱品牌筛选参考 - 资讯焦点
  • CC-VQA技术:解决视觉问答中的知识冲突问题
  • 北京鲎试剂供应商技术能力盘点与选型参考 - 资讯焦点
  • LangGPT结构化提示词设计:5分钟从新手到专家的完整指南
  • Cursor 实战:AI 编程的最佳工作流配置(2026 Cursor 3 最新版)
  • 分布式事务方案梳理
  • BES2800BP_nuttx编译环境搭建方法
  • 2026河南无塔供水器与二次加压供水设备深度横评选购指南 - 精选优质企业推荐官
  • 汽车行业品牌营销策划哪家公司靠谱?奇正沐古助力嘉实多 - 资讯焦点
  • 全国最推荐的全球本地付款企业平台厂家有哪些?2026年上海广东深圳等地区市场选择前五排名 - 十大品牌榜
  • 展厅设计施工公司全国实力盘点:成都汉诺会展重磅上榜 - 速递信息
  • 2026年全国硅胶制品定制厂家优选 聚焦精密定制与合规生产 品质有保障 - 深度智识库
  • AI编程助手架构复盘:从模型选型到工程化落地的挑战与反思
  • 如何快速批量下载ASMR音频资源:asmr-downloader完整使用指南
  • B2B决策入口重构|2026深圳本地GEO优化公司推荐 - 品牌评测官
  • 辽宁园林绿化观赏草供应商实力排行:5家靠谱商家盘点 - 资讯焦点
  • 2026年宁波比较好的一对一日语有哪些 - 品牌排行榜
  • Python实战:Himawari-8卫星NC数据转TIFF,手把手教你用GDAL搞定地理投影