当前位置: 首页 > news >正文

Umi-OCR Docker 部署

Umi-OCR Docker 部署

来源:https://github.com/hiroi-sora/Umi-OCR/blob/main/docs/http/api_ocr.md

部署前,请检查主机的CPU是否具有AVX指令集:

lscpu | grep avx

如果输出了类似如下的结果,那么可以继续部署。

Flags:          ... avx ... avx2 ...

如果看不到任何输出,这表明当前CPU不支持AVX指令集,暂时无法使用 Umi-OCR-Linux 。

1. 下载 Dockerfile

wget https://raw.githubusercontent.com/hiroi-sora/Umi-OCR_runtime_linux/main/Dockerfile

2. 构建镜像

docker build -t umi-ocr-paddle .

说明:

  • 设置镜像名称为 umi-ocr-paddle 。(Dockerfile默认下载使用 PaddleOCR-json 引擎)

构建过程中会自动从 Github 下载 Umi-OCR 发行包等文件。如果遇到网络问题,可能需要设置代理:

docker build -t umi-ocr-paddle . \--build-arg HTTP_PROXY=http://X.X.X.X:7897 \--build-arg HTTPS_PROXY=http://X.X.X.X:7897

3. 运行容器

无头模式

适合在没有显示器的云服务器、不支持X显示协议的系统、或者不需要GUI界面时使用。让 Umi-OCR 提供 HTTP 接口服务。

docker run -d --name umi-ocr \-e HEADLESS=true \-p 1224:1224 \umi-ocr-paddle

说明:

  • 设置容器名称为 umi-ocr 。你也可以设置为任意名称。
  • 设置环境变量 -e HEADLESS=true 启用无头模式。
  • 设置端口转发 -p xxxx:1224 ,将容器内的1224端口转发给主机xxxx端口。
  • 使用的镜像为 umi-ocr-paddle
  • HTTP接口手册

GUI 模式

适合在有显示器的 Xorg 桌面环境下使用,可使用截屏、文件导入等功能。

需要在主机上开放 X 服务权限,允许容器内的应用连接到宿主机桌面。

xhost +
docker run -d --name umi-ocr \-v /tmp/.X11-unix:/tmp/.X11-unix -e DISPLAY=$DISPLAY \-v /home:/home \-p 1224:1224 \umi-ocr-paddle

说明:

  • /tmp/.X11-unix 挂载到容器内,将主机显示器信息 $DISPLAY 传给容器内环境。
  • 将主机 home 目录挂载到容器内的 相同路径 ,使文件拖拽导入的功能生效。
    • 如果需要导入更多路径的文件,可自行挂载。注意,主机路径和容器路径必须相同,如 -v /aa/bb/cc:/aa/bb/cc
  • 容器运行后,等待数秒,即可在主机屏幕上显示 Umi-OCR 的窗口。

4. GUI 模式的控制

如果点击 Umi-OCR 窗口右上角的 × ,前台窗口会被关闭。但 Umi 仍会在后台活动,提供HTTP接口服务。

重新打开窗口 指令:

docker exec umi-ocr /bin/sh -c "/app/umi-ocr.sh --show"

截图OCR 指令:

docker exec umi-ocr /bin/sh -c "/app/umi-ocr.sh --screenshot"

更多指令请参考 命令行手册 。如果需要传入文件路径(如 --path 指令),请确保该文件的任意上级目录,在 docker run 时已通过 -v 挂载到容器中。

Docker GUI 模式可以使用大部分功能,就像主机中的普通应用一样:

  • 访问宿主机内存,进行屏幕截图、粘贴图片。
  • 访问宿主机硬盘,拖拽导入本地文件。(只能访问被挂载到容器中的路径)

Docker 中部分功能受限,无法使用:

  • 创建桌面、开始菜单快捷方式。
  • 系统托盘区图标。

如果在容器内部的命令行输出,发现以下报错,忽略即可,不用管。

ERROR: No native SystemTrayIcon implementation available.
Qt Labs Platform requires Qt Widgets on this setup.
Add 'QT += widgets' to .pro and create QApplication in main().ERROR: No native Menu implementation available.
Qt Labs Platform requires Qt Widgets on this setup.
Add 'QT += widgets' to .pro and create QApplication in main().
http://www.jsqmd.com/news/415301/

相关文章:

  • 设计心得—隔离变化的实现方法之适配器
  • 厦门新春情侣夜游热榜TOP5|欢乐光域厦门园博苑灯会C位出圈,浪漫值拉满 - 速递信息
  • 计算机毕业设计springboot高校志愿者管理系统 基于SpringBoot的高校公益服务与志愿活动数字化管理平台 SpringBoot框架下高校志愿服务智慧管理与活动运营系统
  • 2026Q1临沂靠谱财税公司推荐,好记账帮你避开所有陷阱 - 品牌智鉴榜
  • 计算机毕业设计springboot高校学业导师工作管理系统 基于SpringBoot的高校本科生学业指导与师生互选平台 SpringBoot框架下高校学业导师制数字化服务平台的设计与实现
  • 供应链变革新:10个AI智能体落地,打造数字化供应链领域AI智能体 - 智慧园区
  • 解锁AI Agent商用密码:从理论到实践的极简框架设计与上下文工程深度解析(收藏必备)
  • 别让企业知识库“沉睡”!开源RAG技术+ChatWiki,快速搭建专属AI问答系统,效率翻倍!收藏必备!
  • Datawhale干货:AI智能体框架大比拼!从零入门,轻松构建可靠应用,速收藏!
  • 拒绝办公铁皮柜,适合豪宅书房的高端保险柜精选 - 速递信息
  • Kafka学习笔记——基础入门
  • 【功能演示】按钮组件设置点击一个时另一个取消选中
  • 经期更安心:5款安全的卫生巾品牌推荐 - 速递信息
  • 豆包AI内容如何优化,2026年抢占首位推荐实战策略 - 品牌2026
  • 2026年2月杭州宣传片公司权威推荐,案例丰富口碑靠谱机构 - 品牌鉴赏师
  • 考试总结 2026.2.26
  • 公寓管理系统怎么选?寓盟管家一站式管房更省心省力 - 速递信息
  • 一文搞定相关性分析
  • 2026年2月26日
  • 手把手教你在预训练权重中嵌入多 Token 预测加速
  • 从文本到动态影像:深度解析 Wan2.2-T2V-A5B 如何革新 AI 视频生成
  • 这就是我!真正的龙虾!
  • 十年老炉“氮气失控”谁之过?ROS残氧穿梭机数据驱动下的“设备就医”实录! - 品牌企业推荐师(官方)
  • ,这才是我的真实照片!
  • C#调用Sqlite
  • 我用飞书控制AI助手
  • 怀旧不是因为旧事美好才去怀念它
  • 2月28号直播丨SHMEM开发:开启分布式编程的“直连时代”
  • 展会邀请 | VCAM 诚邀您莅临 NEPCON ASIA 2024,探索电子智造无限可能! - 品牌企业推荐师(官方)
  • 初创公司为何需要好的网站域名?