当前位置：首页 > news >正文

Lychee Rerank MM部署教程：NVIDIA驱动+Docker+NGC镜像兼容性配置要点

news 2026/7/15 0:58:01

Lychee Rerank MM部署教程：NVIDIA驱动+Docker+NGC镜像兼容性配置要点

1. 系统概述与环境准备

Lychee Rerank MM是一个基于Qwen2.5-VL构建的高性能多模态重排序系统，由哈工大（深圳）自然语言处理团队开发。它能够有效解决多模态检索场景中查询与文档之间的精准语义匹配问题。

1.1 硬件要求

GPU：建议使用NVIDIA A10、A100或RTX 3090及以上显卡
显存：至少16GB，推荐20GB以上
内存：32GB及以上
存储：至少50GB可用空间

1.2 软件依赖

操作系统：Ubuntu 20.04/22.04 LTS
NVIDIA驱动：515.x或更高版本
Docker：20.10及以上版本
NVIDIA Container Toolkit：最新稳定版

2. NVIDIA驱动安装与验证

2.1 驱动安装步骤

检查当前GPU信息：
```
lspci | grep -i nvidia
```

添加官方驱动仓库：

sudo add-apt-repository ppa:graphics-drivers/ppa sudo apt update

安装推荐驱动版本：

ubuntu-drivers devices sudo apt install nvidia-driver-535

重启系统使驱动生效：
```
sudo reboot
```

2.2 驱动验证

安装完成后，执行以下命令验证：

nvidia-smi

正常输出应显示GPU信息、驱动版本和CUDA版本。确保驱动版本符合要求，且GPU显存显示正确。

3. Docker与NVIDIA容器工具包配置

3.1 Docker安装

卸载旧版本（如有）：

sudo apt remove docker docker-engine docker.io containerd runc

安装依赖：

sudo apt update sudo apt install apt-transport-https ca-certificates curl gnupg lsb-release

添加Docker官方GPG密钥：

curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg

设置稳定版仓库：

echo "deb [arch=amd64 signed-by=/usr/share/keyrings/docker-archive-keyring.gpg] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null

安装Docker引擎：

sudo apt update sudo apt install docker-ce docker-ce-cli containerd.io

3.2 NVIDIA Container Toolkit安装

设置仓库和GPG密钥：

distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list

安装nvidia-container-toolkit：

sudo apt update sudo apt install -y nvidia-container-toolkit

重启Docker服务：
```
sudo systemctl restart docker
```

验证安装：

docker run --rm --gpus all nvidia/cuda:11.6.2-base-ubuntu20.04 nvidia-smi

4. NGC镜像拉取与配置

4.1 获取NGC API密钥

访问NGC官网并登录
进入"Setup" → "API Key"页面
生成新的API密钥并保存

4.2 登录NGC Docker Registry

docker login nvcr.io

输入用户名为$oauthtoken，密码为你的NGC API密钥。

4.3 拉取Qwen2.5-VL基础镜像

docker pull nvcr.io/nvidia/pytorch:23.10-py3

5. Lychee Rerank MM部署

5.1 获取项目代码

git clone https://github.com/HIT-SZ-NLP/Lychee-Rerank-MM.git cd Lychee-Rerank-MM

5.2 构建Docker镜像

修改Dockerfile（如有需要）：

FROM nvcr.io/nvidia/pytorch:23.10-py3 WORKDIR /app COPY . . RUN pip install -r requirements.txt

构建镜像：
```
docker build -t lychee-rerank-mm .
```

5.3 运行容器

docker run --gpus all -p 8080:8080 -v $(pwd):/app lychee-rerank-mm

5.4 启动应用

bash /root/build/start.sh

6. 常见问题解决

6.1 CUDA版本不兼容

如果遇到CUDA相关错误，检查驱动与CUDA版本兼容性：

nvidia-smi nvcc --version

确保两者版本匹配，必要时重新安装兼容版本。

6.2 显存不足问题

如果显存不足，可以尝试以下方法：

降低批量大小
使用--max_split_size_mb参数限制显存分配
启用梯度检查点

6.3 Docker权限问题

如果遇到权限错误，将当前用户加入docker组：

sudo usermod -aG docker $USER newgrp docker

7. 总结

本教程详细介绍了Lychee Rerank MM系统的完整部署流程，包括：

NVIDIA驱动安装与验证
Docker与NVIDIA容器工具包配置
NGC镜像拉取与兼容性设置
项目部署与启动
常见问题解决方案

通过以上步骤，您应该能够成功部署Lychee Rerank MM系统并开始使用其强大的多模态重排序功能。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

查看全文

http://www.jsqmd.com/news/331365/

Qwen3-Embedding-4B一文详解：Streamlit状态管理如何支撑多轮语义测试

Qwen3-4B Instruct-2507多场景：会议纪要提炼→待办事项拆解→邮件草稿生成

会议纪要转语音：GLM-TTS办公自动化新玩法

【AUTOSAR-CAN】深入解析BasicCAN与FullCAN架构在CanIf模块中的关键作用

突破硬件限制：老旧Mac设备的系统升级解决方案

OFA图像语义蕴含模型开箱即用：手把手教你跑通第一个案例

Joy-Con Toolkit高级技术指南：从原理到扩展开发

Topit：窗口管理效率革命，让Mac多任务处理如行云流水

LLaVA-v1.6-7B视觉助手：5分钟快速部署Ollama多模态服务

EasyAnimateV5-7b-zh-InP部署教程：内网0.0.0.0:7860访问与防火墙配置要点

OFA视觉问答模型镜像：轻松实现图片内容自动解析

ChatTTS在内容创作中的应用：自动生成视频配音脚本

PyTorch-2.x-Universal-Dev-v1.0实测报告，优劣分析一文看懂

从零开始：HX711电子秤DIY全流程与避坑指南

Z-Image-ComfyUI优化技巧：提升生成效率的小妙招

万物识别镜像使用全记录：上传图片即出结果超简单

结构化文本转语音：VibeVoice在内容创作中的应用

Qwen3-VL:30B镜像免配置实战：星图平台一键启动+Clawdbot飞书接入保姆级教学

游戏串流服务器优化：低延迟配置与跨设备串流诊断指南

GTE-ProRAG知识库底座部署教程：向量数据库+API服务+Web界面

HeyGem性能实测：CPU和GPU速度对比

LongCat-Image-Editn实战教程：中英双语一句话改图，非编辑区零扰动

ERNIE-4.5-0.3B-PT轻量部署价值：中小企业AI降本50%+提效3倍实证案例

网页端集成OCR功能：cv_resnet18_ocr-detection API调用思路

告别文档搜索烦恼！WeKnora智能问答系统保姆级教程

从0开始学视觉语言模型：GLM-4.6V-Flash-WEB新手指南

智能电视优化指南：老旧设备性能提升与直播应用配置全攻略

音频格式解密工具全攻略：从加密困境到跨平台播放自由

LFM2.5-1.2B-Thinking开源大模型部署教程：Ollama环境零配置快速上手

3D打印工作流技术解析与实战指南