当前位置：首页 > news >正文

深求·墨鉴部署教程：基于阿里云ECS的DeepSeek-OCR-2轻量级服务搭建

news 2026/7/5 4:36:43

深求·墨鉴部署教程：基于阿里云ECS的DeepSeek-OCR-2轻量级服务搭建

想把那些堆在角落的纸质文件、拍得歪歪扭扭的会议白板照片，快速变成可以编辑、可以搜索的电子文档吗？今天，我就带你亲手搭建一个属于自己的“数字文房”——深求·墨鉴。

这是一个基于DeepSeek-OCR-2模型的文档解析工具，但它又不止于此。它把冷冰冰的OCR技术，包装成了一种带有东方水墨美学的体验。你不需要懂复杂的深度学习，跟着这篇教程，在阿里云ECS服务器上花点时间，就能拥有一个私人的、高效的文档识别助手。

它能帮你做什么？简单说，就是“看图识字”，但识得特别准，还能保持原文的排版、表格甚至公式。更妙的是，它的操作界面就像一幅展开的卷轴，用起来有种在书房静心工作的感觉。下面，我们就从零开始，把它“请”到你的云服务器上。

1. 环境准备与服务器选购

在开始“研墨”之前，我们得先准备好“文房四宝”——也就是运行环境。核心是一台云服务器，这里我们选择阿里云ECS，因为它对国内用户来说访问稳定、配置灵活。

1.1 选择适合的ECS配置

你不需要一台特别昂贵的服务器。深求·墨鉴基于轻量的DeepSeek-OCR-2模型，对资源要求比较友好。我推荐以下配置，兼顾了性能和成本：

实例规格：选择“通用型g7”或“计算型c7”系列。例如，ecs.g7.large（2核8G）或ecs.c7.large（2核4G）就完全足够。如果预计处理量很大，可以考虑4核16G的配置。
镜像系统：务必选择 Ubuntu 20.04 或 22.04 LTS 64位。这是最兼容、社区支持最好的选择，能避免很多依赖库的安装问题。
系统盘：至少50GB的高效云盘或ESSD。因为我们要安装Docker、模型文件和一些系统依赖，留足空间更省心。
网络与安全组：购买时，在安全组规则里提前放行两个端口：
- 22端口：用于SSH连接服务器，必须开放。
- 7860端口：这是深求·墨鉴Web服务的默认端口，必须开放。
- （可选）80/443端口：如果你后续想用域名访问，可能需要开放。

购买完成后，记下你的服务器公网IP地址、登录密码（或密钥对）。接下来，我们就要登上去开始布置了。

1.2 首次登录与基础环境设置

打开你的终端（Windows用户可以用PowerShell或PuTTY，Mac/Linux用户直接用终端），使用SSH命令连接服务器。

ssh root@你的服务器公网IP

输入密码后，你就进入了服务器的命令行世界。首先，我们更新一下系统软件包列表，确保安装的都是最新版本。

apt update && apt upgrade -y

更新完成后，安装一些必要的工具，比如用于管理、下载和压缩解压的软件。

apt install -y curl wget vim git unzip

2. 核心依赖安装：Docker与NVIDIA驱动

深求·墨鉴推荐使用Docker来部署，这能解决环境依赖的难题，实现“一次构建，到处运行”。如果你的ECS服务器带有GPU（比如选择了GPU计算型实例），并且希望获得更快的识别速度，还需要安装NVIDIA的驱动和工具。

2.1 安装Docker与Docker Compose

Docker是容器化技术的核心。我们使用官方提供的一键安装脚本，非常方便。

# 下载并运行Docker安装脚本 curl -fsSL https://get.docker.com -o get-docker.sh sudo sh get-docker.sh # 将当前用户加入docker组，这样以后就不用每次都加sudo了 sudo usermod -aG docker $USER # 注意：用户组生效需要重新登录，可以先执行以下命令临时生效 newgrp docker

接着安装Docker Compose，它是一个用于定义和运行多容器Docker应用的工具。

# 下载Docker Compose的稳定版本 sudo curl -L "https://github.com/docker/compose/releases/latest/download/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose # 赋予执行权限 sudo chmod +x /usr/local/bin/docker-compose # 验证安装 docker --version docker-compose --version

如果这两条命令都能正确输出版本号，说明安装成功。

2.2 （可选）为GPU实例安装驱动

这一步仅针对带有NVIDIA GPU的ECS实例。如果你用的是纯CPU实例，可以跳过。

首先，你需要确保在购买ECS时，选择了“自动安装GPU驱动”的选项，或者手动安装。手动安装步骤稍复杂，但阿里云有详细的官方文档。核心是安装：

NVIDIA显卡驱动。
NVIDIA Container Toolkit（让Docker能使用GPU）。

安装完成后，你可以运行以下命令来验证GPU是否可以被Docker识别：

docker run --rm --gpus all nvidia/cuda:11.8.0-base-ubuntu22.04 nvidia-smi

如果能看到显卡信息表格，就说明GPU环境配置成功了。

3. 部署深求·墨鉴服务

环境准备好了，现在可以把主角“请”出来了。我们将使用Docker Compose来部署，这是最简单清晰的方式。

3.1 创建项目目录与配置文件

首先，在服务器上找一个合适的地方，创建一个项目目录。

mkdir -p /opt/deepseek-ocr-inkstone cd /opt/deepseek-ocr-inkstone

然后，创建Docker Compose的配置文件docker-compose.yml。这个文件描述了我们服务需要的一切：用什么镜像、开放什么端口、挂载什么目录。

vim docker-compose.yml

按i进入编辑模式，粘贴以下内容。这里我们使用一个预先构建好的镜像，它包含了深求·墨鉴的完整应用和DeepSeek-OCR-2模型。

version: '3.8' services: deepseek-ocr-inkstone: image: registry.cn-hangzhou.aliyuncs.com/your_namespace/deepseek-ocr-inkstone:latest # 请替换为实际可用的镜像地址 container_name: deepseek-ocr-inkstone restart: unless-stopped ports: - "7860:7860" # 将容器的7860端口映射到主机的7860端口 environment: - GRADIO_SERVER_NAME=0.0.0.0 # 允许所有IP访问 volumes: - ./uploaded_images:/app/uploaded_images # 挂载一个目录，用于持久化上传的图片（可选） # 如果服务器有GPU，取消下面这行的注释，并确保已安装NVIDIA Container Toolkit # deploy: # resources: # reservations: # devices: # - driver: nvidia # count: all # capabilities: [gpu]

重要提示：上面的image地址registry.cn-hangzhou.aliyuncs.com/your_namespace/deepseek-ocr-inkstone:latest是一个占位符。你需要将其替换为深求·墨鉴项目官方提供的真实Docker镜像地址，或者你自己构建的镜像地址。请根据项目发布页面的指引进行替换。

粘贴完成后，按ESC键，然后输入:wq保存并退出vim。

3.2 启动服务

配置文件就绪后，一行命令即可启动服务。

docker-compose up -d

-d参数表示在后台运行。执行后，Docker会去拉取镜像（如果本地没有），然后创建并启动容器。

你可以用以下命令查看容器运行状态和日志：

# 查看容器状态 docker-compose ps # 查看实时日志（按Ctrl+C退出） docker-compose logs -f

如果看到日志显示Running on local URL: http://0.0.0.0:7860，并且没有持续报错，说明服务已经成功启动。

4. 使用与验证：你的数字文房开张了

服务跑起来后，打开你的浏览器，访问http://你的服务器公网IP:7860。如果一切顺利，你将看到深求·墨鉴那充满水墨韵味的主界面。

4.1 四步完成文档解析

界面非常直观，操作就像它的设计理念一样，充满仪式感：

卷轴入画：点击左侧虚线区域，或者直接把图片文件拖进去。它支持常见的JPG、PNG格式。
研墨启笔：点击那个醒目的红色“研墨启笔”印章按钮。这时，服务器就开始调用DeepSeek-OCR-2模型对你的图片进行解析了。根据图片复杂程度，可能需要几秒到十几秒，请稍候。
鉴赏结果：
- 墨影初现标签页：这里以美观的排版样式展示识别出的文字，阅读体验很好。
- 经纬原典标签页：这里展示原始的Markdown格式文本，你可以直接复制到支持Markdown的笔记软件（如Obsidian、Notion）中。
- 笔触留痕标签页：这个功能很有趣，它会用半透明的方框在原图上标出AI识别到的每一个文字区域，让你直观地看到识别是否准确、有无遗漏。
藏书入匣：满意之后，点击右下角的“下载 Markdown”按钮，就能把识别结果保存到本地了。

4.2 常见问题排查

如果访问不了页面，可以按以下顺序检查：

检查服务状态：docker-compose ps确认容器是Up状态。
检查端口：在服务器上运行netstat -tlnp | grep 7860，看7860端口是否被监听。
检查安全组：这是最常见的问题！务必登录阿里云ECS控制台，找到你的实例，查看“安全组”规则，确认7860端口是否已经对0.0.0.0/0（或你的IP）开放。
查看错误日志：docker-compose logs deepseek-ocr-inkstone查看具体的错误信息。