当前位置：首页 > news >正文

水墨江南模型Ubuntu系统部署教程：从零开始的环境配置

news 2026/6/10 8:40:31

水墨江南模型Ubuntu系统部署教程：从零开始的环境配置

最近有不少朋友在问，那个能生成水墨画风格图片的AI模型——“水墨江南”，到底怎么在自己的服务器上跑起来？特别是用Ubuntu系统的。网上的教程要么太零散，要么默认你已经是个Linux老手，对新手不太友好。

今天，我就来写一份真正从零开始的保姆级指南。你不用懂太多复杂的Linux命令，也不用担心环境冲突，跟着步骤一步步来就行。我们用的系统是Ubuntu 20.04，这也是目前很多云服务器和本地开发机的主流选择，兼容性比较好。

整个流程，我会带你走完这几步：先把系统环境收拾干净，装好必要的“地基”软件；然后去一个叫“星图GPU平台”的地方，把现成的模型镜像搬下来；接着，我们创建一个独立的Python小房间，把所有需要的工具包放进去，避免和系统其他软件打架；最后，启动服务，看看这个“水墨江南”模型到底能不能画出漂亮的画。

好了，话不多说，咱们开始动手。

1. 第一步：打好地基——系统更新与核心依赖安装

在安装任何AI模型之前，确保你的Ubuntu系统是最新、最稳定的状态，并且装好了必要的底层驱动和框架，这是最关键的一步。你可以把它想象成盖房子前，先要把地基打牢。

首先，我们打开终端（Terminal），用下面几条命令来更新系统软件包列表并升级已有的软件。这能修复一些已知的安全漏洞和兼容性问题。

sudo apt update sudo apt upgrade -y

更新完成后，我们需要安装一些基础开发工具和Python环境。Python是运行大多数AI模型的“普通话”，必须得先装好。

sudo apt install -y python3-pip python3-dev python3-venv build-essential

接下来是重头戏：安装NVIDIA的显卡驱动和CUDA工具包。如果你的服务器或电脑有NVIDIA显卡，这一步能让模型跑得更快。如果没有显卡（只用CPU），可以跳过驱动安装，但CUDA相关的PyTorch安装命令需要调整。

安装显卡驱动（有NVIDIA显卡才需要）：你可以使用Ubuntu自带的附加驱动工具，或者用命令行安装。这里用命令行方式，安装一个稳定版本的驱动。
```
sudo apt install -y nvidia-driver-470 # 版本号可根据你的显卡型号调整，470是一个较通用的稳定版本
```
安装完成后，重启系统让驱动生效：sudo reboot。重启后，可以用nvidia-smi命令检查驱动是否安装成功，如果能看到显卡信息，就说明没问题。

安装CUDA工具包（推荐，即使只用CPU，某些库的GPU版本也依赖CUDA运行时）：我们通过PyTorch官方渠道来间接安装匹配的CUDA，这样最省心。但需要先安装一个基础的CUDA工具包。这里以CUDA 11.3为例（与后续PyTorch版本兼容性好）。

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600 sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/7fa2af80.pub sudo add-apt-repository "deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/ /" sudo apt update sudo apt install -y cuda-toolkit-11-3

安装后，将CUDA添加到系统路径。编辑你的~/.bashrc文件（如果你用的是zsh，则是~/.zshrc）：

echo 'export PATH=/usr/local/cuda-11.3/bin${PATH:+:${PATH}}' >> ~/.bashrc echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.3/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}' >> ~/.bashrc source ~/.bashrc

执行nvcc --version可以验证CUDA是否安装成功。

地基部分到这里就差不多了。我们更新了系统，装好了Python和CUDA，接下来就可以准备迎接“主角”了。

2. 第二步：获取模型镜像——从星图GPU平台拉取

“水墨江南”模型本身包含预训练好的参数文件和推理代码。为了方便部署，很多平台提供了打包好的镜像。这里我们假设从“星图GPU平台”获取了一个名为ink-wash-jiangnan:latest的Docker镜像。

如果你已经在星图平台找到了这个镜像，并且平台提供了镜像拉取地址（通常是一个仓库地址），那么使用Docker拉取是最简单的方式。首先确保安装了Docker：

sudo apt install -y docker.io sudo systemctl start docker sudo systemctl enable docker # 将当前用户加入docker组，避免每次用sudo sudo usermod -aG docker $USER # 需要重新登录终端使组生效

然后拉取镜像（请将your-registry-address/ink-wash-jiangnan:latest替换为实际的镜像地址）：

docker pull your-registry-address/ink-wash-jiangnan:latest

另一种更常见的本地部署方式：平台可能直接提供模型文件（如.ckpt或.safetensors权重文件）和推理脚本。你需要将这些文件下载到你的服务器某个目录，比如/home/yourname/ink_jiangnan/。

为了教程的通用性，我们假设你采用第二种方式，已经将模型文件（例如ink_model.safetensors）和相关的Python推理代码（如app.py,model.py）下载到了本地目录/home/workspace/ink_jiangnan/下。

接下来的步骤，我们就在这个目录里操作。

3. 第三步：创建独立环境——配置Python虚拟环境

为什么一定要用虚拟环境？因为不同的AI项目可能依赖不同版本、甚至互相冲突的Python库。虚拟环境就像给你的“水墨江南”项目单独分配了一个干净的房间，里面装什么软件都不会影响到屋外（系统全局环境）。

进入你的项目目录，然后创建虚拟环境：

cd /home/workspace/ink_jiangnan python3 -m venv venv

这条命令会在当前目录下创建一个名为venv的文件夹，里面就是一个独立的Python环境。接下来，激活这个环境：

source venv/bin/activate

激活后，你的命令行提示符前面通常会显示(venv)，表示你现在已经在这个“小房间”里工作了。接下来所有通过pip安装的包，都会装在这个房间里。

4. 第四步：安装运行库——模型推理所需依赖

现在，我们要在这个干净的房间里，安装“水墨江南”模型运行所需要的所有Python库。通常，项目会提供一个requirements.txt文件，里面列出了所有需要的库及其版本。如果你有这个文件，安装就非常简单：

pip install -r requirements.txt

如果没有这个文件，或者你想手动安装核心依赖，那么通常需要以下这些（具体可能根据模型代码有所不同）：

# 首先升级pip和安装wheel pip install --upgrade pip wheel # 安装PyTorch及其视觉库（请根据你的CUDA版本选择，这里是CUDA 11.3的示例） # 可以去PyTorch官网（https://pytorch.org/get-started/locally/）获取最准确的安装命令 pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu113 # 安装常用的AI相关库 pip install transformers diffusers accelerate pip install pillow numpy scipy pip install flask gradio # 如果模型提供Web界面，可能需要这些

安装过程可能会花点时间，取决于你的网络速度和需要编译的包。安装完成后，你可以用pip list看看都装了哪些包。

5. 第五步：配置与启动——设置服务并测试

环境都准备好了，模型文件也到位了，现在就是最后一步：让模型跑起来，并提供一个我们可以访问的接口。

5.1 检查模型路径与配置文件

首先，确保你的模型权重文件（比如ink_model.safetensors）放在代码期望的位置。通常推理脚本里会有一个地方指定模型路径，你需要根据实际情况修改。例如，在app.py或config.yaml中，找到类似model_path: "./models/"这样的配置，确保路径指向你存放模型文件的真实目录。

5.2 设置服务端口与权限

模型服务通常通过一个网络端口（比如7860或5000）对外提供。我们需要确保这个端口没有被占用，并且防火墙允许访问。

检查端口占用：sudo lsof -i:7860。如果被占用，可以考虑换一个端口，或者停止占用该端口的进程。
开放防火墙端口（如果系统防火墙开启）：
```
sudo ufw allow 7860 sudo ufw reload
```

5.3 启动模型推理服务

根据模型提供的启动方式，运行服务。常见的有以下几种：

直接运行Python脚本：
```
python app.py
```
这可能会启动一个本地Web服务。
使用Gradio启动（如果代码基于Gradio）：脚本里可能已经有demo.launch()语句，直接运行脚本即可。你可能会看到输出里有一行类似Running on local URL: http://127.0.0.1:7860的信息。
使用生产级服务器启动（如搭配Gunicorn）：对于Flask等应用，为了更稳定，可以用：
```
gunicorn -w 4 -b 0.0.0.0:7860 app:app
```