当前位置：首页 > news >正文

GLM-OCR开源镜像部署：离线环境pip依赖包打包与本地安装方案

news 2026/5/12 14:04:13

GLM-OCR开源镜像部署：离线环境pip依赖包打包与本地安装方案

1. 项目概述与离线部署需求

GLM-OCR是一个基于GLM-V编码器-解码器架构构建的高性能多模态OCR模型，专门为复杂文档理解而设计。这个模型集成了在大规模图文数据上预训练的CogViT视觉编码器、轻量级跨模态连接器以及GLM-0.5B语言解码器，支持文本识别、表格识别和公式识别等多种功能。

在实际部署过程中，很多企业环境由于网络安全要求，无法直接访问外网进行pip包安装。这就需要我们在有网络的环境中预先打包所有依赖，然后在离线环境中进行本地安装。本文将详细介绍GLM-OCR的离线依赖包打包和安装方案，帮助你在隔离网络环境中顺利完成部署。

离线部署的核心价值：

保障企业内部网络安全，避免直接连接外网
确保依赖包版本一致性，避免版本冲突
提高部署效率，一次打包多次使用
支持无外网环境的服务器部署

2. 环境准备与依赖分析

2.1 基础环境要求

在开始打包之前，我们需要准备一个与目标环境相同配置的在线环境：

# 创建相同的conda环境 conda create -n py310 python=3.10.19 -y conda activate py310 # 验证Python版本 python --version # 应该输出 Python 3.10.19

2.2 核心依赖包分析

GLM-OCR项目的主要依赖包括：

transformers：5.0.1.dev0（需要从GitHub源码安装）
torch：2.9.1（PyTorch深度学习框架）
gradio：Web界面框架
其他辅助包：numpy、Pillow、opencv-python等

3. 在线环境依赖包打包

3.1 创建打包工作目录

首先在有网络的环境中创建打包工作目录：

# 创建工作目录 mkdir -p ~/glm-ocr-offline-packages cd ~/glm-ocr-offline-packages # 创建requirements.txt文件 cat > requirements.txt << EOF torch==2.9.1 gradio numpy Pillow opencv-python tqdm requests EOF

3.2 下载和打包依赖包

使用pip download命令下载所有依赖包：

# 下载所有依赖包到packages目录 pip download -r requirements.txt -d ./packages --no-deps # 特别处理transformers的GitHub源码 git clone https://github.com/huggingface/transformers.git cd transformers git checkout v5.0.1.dev0 # 切换到指定版本 cd .. # 将transformers源码打包 tar -czf transformers-5.0.1.dev0.tar.gz transformers/ mv transformers-5.0.1.dev0.tar.gz packages/

3.3 创建安装脚本

编写离线安装脚本，确保安装顺序正确：

# 创建install_offline.sh安装脚本 cat > install_offline.sh << 'EOF' #!/bin/bash # 检查是否在conda环境中 if [ -z "$CONDA_DEFAULT_ENV" ]; then echo "请先在conda环境中运行此脚本" exit 1 fi # 安装基础依赖包 echo "正在安装基础依赖包..." pip install --no-index --find-links=./packages torch==2.9.1 pip install --no-index --find-links=./packages gradio pip install --no-index --find-links=./packages numpy pip install --no-index --find-links=./packages Pillow pip install --no-index --find-links=./packages opencv-python pip install --no-index --find-links=./packages tqdm pip install --no-index --find-links=./packages requests # 安装transformers从源码 echo "正在安装transformers..." tar -xzf packages/transformers-5.0.1.dev0.tar.gz cd transformers pip install -e . cd .. echo "所有依赖包安装完成！" EOF # 使脚本可执行 chmod +x install_offline.sh

3.4 打包完整离线安装包

将所有内容打包成一个完整的离线安装包：

# 创建最终的离线安装包 tar -czf glm-ocr-offline-packages-$(date +%Y%m%d).tar.gz \ packages/ \ requirements.txt \ install_offline.sh echo "离线安装包已创建：glm-ocr-offline-packages-$(date +%Y%m%d).tar.gz"

4. 离线环境部署步骤

4.1 传输和准备离线环境

将打包好的离线安装包传输到目标服务器：

# 在目标服务器上操作 # 将离线包复制到服务器（根据实际情况选择传输方式） # scp glm-ocr-offline-packages-20231201.tar.gz user@server:/path/to/ # 解压离线包 tar -xzf glm-ocr-offline-packages-20231201.tar.gz cd glm-ocr-offline-packages

4.2 安装依赖包

在离线环境中执行安装脚本：

# 激活conda环境 conda activate py310 # 运行安装脚本 ./install_offline.sh

4.3 验证安装结果

检查所有依赖包是否正确安装：

# 验证主要包版本 python -c " import torch print(f'PyTorch版本: {torch.__version__}') import gradio print(f'Gradio版本: {gradio.__version__}') from transformers import __version__ as transformers_version print(f'Transformers版本: {transformers_version}') " # 检查CUDA是否可用（如果使用GPU） python -c "import torch; print(f'CUDA可用: {torch.cuda.is_available()}')"

5. GLM-OCR项目部署与验证

5.1 下载和配置GLM-OCR项目

在离线环境中部署GLM-OCR项目：

# 假设GLM-OCR项目已经通过其他方式传输到服务器 cd /root/GLM-OCR # 检查项目结构 ls -la

5.2 启动GLM-OCR服务

使用项目提供的启动脚本启动服务：

# 给予启动脚本执行权限 chmod +x start_vllm.sh # 启动服务 ./start_vllm.sh

首次启动提示：由于模型文件较大（约2.5GB），首次启动需要1-2分钟加载时间，请耐心等待。

5.3 验证服务正常运行

检查服务是否正常启动：

# 检查服务进程 ps aux | grep gradio # 检查服务端口 netstat -tlnp | grep 7860 # 查看日志文件 tail -f /root/GLM-OCR/logs/glm_ocr_*.log

6. 常见问题与解决方案

6.1 依赖包版本冲突

如果遇到版本冲突问题，可以尝试以下解决方案：

# 查看当前已安装的包版本 pip list # 如果需要重新安装特定版本 pip install --no-index --find-links=./packages 包名==版本号

6.2 模型加载失败

如果模型加载失败，检查模型文件路径：

# 检查模型文件是否存在 ls -la /root/ai-models/ZhipuAI/GLM-OCR/ # 如果模型文件缺失，需要通过其他方式传输模型文件

6.3 端口冲突处理

如果7860端口被占用，可以终止占用进程或修改服务端口：

# 查看端口占用情况 lsof -i :7860 # 终止占用进程 kill -9 <进程ID> # 或者修改GLM-OCR服务的启动端口 # 编辑start_vllm.sh或serve_gradio.py文件，修改端口配置

7. 总结与最佳实践

通过本文介绍的离线依赖包打包和本地安装方案，你可以在完全离线的环境中成功部署GLM-OCR项目。这种方法不仅适用于GLM-OCR，也可以推广到其他需要离线部署的Python项目。

离线部署的最佳实践：

环境一致性：确保打包环境和目标环境的系统、Python版本一致
版本锁定：使用固定的版本号，避免自动升级导致的不兼容
完整测试：在打包完成后，在模拟环境中进行完整测试
文档记录：详细记录打包的版本号和日期，便于后续维护
定期更新：定期检查并更新依赖包，修复安全漏洞

后续维护建议：

定期检查依赖包的安全更新
建立内部pip镜像源，简化后续部署
编写自动化部署脚本，提高部署效率
建立版本管理制度，确保环境可重现

离线部署虽然增加了前期准备工作，但能够为企业环境提供更安全、稳定的部署方案，特别适合对网络安全有严格要求的生产环境。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

查看全文

http://www.jsqmd.com/news/451922/

REFramework：非侵入式修改的游戏引擎工具集

KrkrzExtract：下一代krkrz引擎解包工具的技术实现与应用指南

零基础入门工业AI：用EagleEye镜像10分钟完成目标检测原型开发

保障Lingbot-Depth-Pretrain-ViTL-14 API安全的网络安全配置实践

REFramework：游戏引擎增强与跨平台适配的非侵入式解决方案

突破鸣潮帧率限制：WaveTools高帧率优化实战指南

Gemma-3-270m企业应用：为客服系统嵌入低延迟文本生成能力

Flutter 三方库 angel3_websocket 的鸿蒙化适配指南 - 掌控实时通信资产、精密 WebSocket 治理实战、鸿蒙级全连通专家

Mac用户必看：3分钟搞定Maven阿里云镜像配置（含.m2文件夹显示技巧）

任务计划恢复实战指南：从系统危机到安全重建

WaveTools：鸣潮120FPS帧率解锁完全指南

Plugin ‘org.springframework.bootspring-boot-maven-plugin‘ not found的解决方法

转录组数据分析实战，仅需99元（视频版）

保姆级教学：雯雯的后宫-造相Z-Image-瑜伽女孩，从部署到出图全流程

单卡就能跑！Qwen3-4B-Instruct-2507轻量部署与性能测试报告

Stable-Diffusion-v1-5-archive效果展示：同一Prompt下不同Seed的多样性呈现

新一代krkrz引擎解包工具：高效提取方案全解析

Janus-Pro-7B实操手册：Gradio主题定制+品牌LOGO嵌入+UI汉化

Asian Beauty Z-Image Turbo参数解析：步数、CFG Scale怎么调？看完就会

SenseVoice Small媒体传播：短视频口播→多平台适配文案自动改写

无需代码！用LiuJuan Z-Image Generator轻松制作个人专属头像/壁纸

taojinbi：淘宝生态自动化任务解决方案，解放双手的效率工具

Qwen-Image-Edit-2511使用指南：ComfyUI中关键参数（edit_strength等）设置技巧

YOLOv12目标检测效果深度解析：多场景对比与性能基准测试

AI 净界网络配置：跨域访问与HTTPS安全设置

Windows Defender任务计划恢复系统修复实战指南

Python3.9环境配置太麻烦？试试这个开箱即用的Miniconda镜像

鸣潮120FPS帧率突破：从卡顿到丝滑的创新解决方案

STM32开发好帮手：Nanbeige 4.1-3B辅助生成嵌入式C代码与调试建议

用ai开发ai：快马平台教你构建智能代码生成器，自动编写大模型调用程序