当前位置：首页 > news >正文

MedGemma 1.5保姆级教程：从Docker拉取镜像到浏览器访问6006端口

news 2026/3/27 0:12:53

MedGemma 1.5保姆级教程：从Docker拉取镜像到浏览器访问6006端口

1. 项目简介

MedGemma 1.5是一款基于Google最新MedGemma-1.5-4B-IT模型构建的本地医疗AI问答系统。这个系统最大的特点是完全运行在你的本地GPU上，不需要联网就能使用，特别适合处理敏感的医疗咨询问题。

简单来说，它就像一个24小时在线的医疗顾问，能够回答各种医学问题、解释病理知识，还能提供初步的医疗建议。最重要的是，你问的所有问题和你得到的回答都只存在于你的电脑里，完全不用担心隐私泄露的问题。

这个系统采用了先进的思维链技术，这意味着它不会直接给你一个答案，而是会先展示它的思考过程，让你能看到它是如何一步步推导出结论的。这种透明化的推理方式，让你更容易判断它的建议是否靠谱。

2. 环境准备

在开始安装之前，你需要确保你的电脑满足以下基本要求：

2.1 硬件要求

GPU：至少8GB显存（推荐RTX 3080或更高）
内存：16GB或以上
存储空间：至少20GB可用空间

2.2 软件要求

操作系统：Ubuntu 20.04/22.04或Windows 10/11（WSL2）
Docker：版本20.10或更高
NVIDIA驱动：最新版本
NVIDIA Container Toolkit：必须安装

如果你还没有安装Docker和NVIDIA相关工具，可以按照以下步骤安装：

# 安装Docker curl -fsSL https://get.docker.com -o get-docker.sh sudo sh get-docker.sh # 安装NVIDIA Container Toolkit distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit sudo systemctl restart docker

3. Docker镜像拉取与部署

现在我们来实际操作，把MedGemma 1.5的镜像拉到本地并运行起来。

3.1 拉取镜像

打开终端，执行以下命令来拉取镜像：

docker pull your-medgemma-image:latest

这个过程可能会花费一些时间，因为镜像大小有几个GB。你可以看到下载进度，等待它完成即可。

3.2 运行容器

镜像拉取完成后，用这个命令来启动容器：

docker run -it --gpus all -p 6006:6006 \ -v /path/to/your/data:/app/data \ --name medgemma-container \ your-medgemma-image:latest

我来解释一下这个命令的各个部分：

--gpus all：让容器能够使用你所有的GPU
-p 6006:6006：把容器内部的6006端口映射到你的电脑的6006端口
-v /path/to/your/data:/app/data：把你电脑上的一个文件夹挂载到容器里，用来保存数据
--name medgemma-container：给容器起个名字，方便以后管理

3.3 验证运行状态

容器启动后，你可以用这个命令检查是否正常运行：

docker ps

你应该能看到medgemma-container正在运行，状态显示为"Up"。

4. 浏览器访问与使用

现在来到最令人期待的部分——实际使用这个医疗AI助手。

4.1 访问服务

打开你常用的浏览器（Chrome、Firefox、Edge都可以），在地址栏输入：

http://localhost:6006

或者如果你的服务运行在其他机器上，输入：

http://你的服务器IP:6006

如果一切正常，你会看到一个简洁的聊天界面，这就是MedGemma的操作界面了。

4.2 开始提问

在底部的输入框里，你可以用中文或英文提问任何医疗相关的问题。比如：

"什么是糖尿病？"
"感冒了应该怎么办？"
"What are the symptoms of heart disease?"

系统支持中英文混合输入，你可以这样问："什么是hypertension，它有什么风险？"

4.3 查看思维过程

MedGemma最特别的地方是它会展示思考过程。当你提问后，它会先显示在<thought>标签中的推理过程（通常是英文），然后再给出正式的回答（通常是中文）。

比如你问"什么是高血压"，它可能会先这样思考：

<thought> 首先需要定义高血压：血压持续高于正常值。正常血压是120/80 mmHg，高血压是140/90 mmHg以上。然后解释成因：可能是遗传、生活方式等。最后说明风险和预防措施。 </thought>

然后再给出正式的中文回答。这个思考过程让你能看到它的推理逻辑，更容易判断回答的可靠性。

4.4 多轮对话

MedGemma支持连续对话，你可以基于之前的回答继续追问。比如：

你：什么是高血压？ MedGemma：高血压是指动脉血压持续升高的慢性疾病... 你：那它的并发症有哪些？ MedGemma：高血压可能引发心脏病、中风、肾脏问题等并发症...

系统会记住对话上下文，让你的咨询体验更加连贯自然。

5. 常见问题解决

在使用过程中可能会遇到一些问题，这里提供一些常见的解决方法：

5.1 端口冲突问题

如果你发现6006端口被其他程序占用了，可以改用其他端口：

docker run -it --gpus all -p 6007:6006 \ -v /path/to/your/data:/app/data \ --name medgemma-container \ your-medgemma-image:latest

这样你就可以通过http://localhost:6007来访问了。

5.2 GPU内存不足

如果遇到GPU内存不足的错误，可以尝试这些方法：

# 减少batch size docker run -it --gpus all -p 6006:6006 \ -e BATCH_SIZE=1 \ -v /path/to/your/data:/app/data \ --name medgemma-container \ your-medgemma-image:latest # 或者使用精度更低的模型 docker run -it --gpus all -p 6006:6006 \ -e PRECISION=fp16 \ -v /path/to/your/data:/app/data \ --name medgemma-container \ your-medgemma-image:latest

5.3 容器自动重启

如果容器意外停止，可以设置自动重启：

docker run -it --gpus all -p 6006:6006 \ --restart unless-stopped \ -v /path/to/your/data:/app/data \ --name medgemma-container \ your-medgemma-image:latest