当前位置：首页 > news >正文

Phi-3-vision-128k-instruct部署教程：vLLM + Chainlit 在国产信创环境验证

news 2026/5/12 11:17:29

Phi-3-vision-128k-instruct部署教程：vLLM + Chainlit 在国产信创环境验证

1. 模型简介

Phi-3-Vision-128K-Instruct 是一个轻量级的开放多模态模型，属于Phi-3模型家族。该模型支持128K上下文长度，专注于高质量、密集推理的文本和视觉数据处理。通过结合监督微调和直接偏好优化，模型具备精确的指令遵循能力和强大的安全措施。

主要特点：

支持图文对话多模态交互
轻量级设计，适合资源有限环境
经过严格的数据增强和优化过程
适用于国产信创环境部署

2. 环境准备

2.1 硬件要求

建议配置：

CPU: 至少16核
内存: 64GB以上
GPU: 推荐NVIDIA显卡，显存16GB以上
存储: 至少50GB可用空间

2.2 软件依赖

确保系统已安装：

Python 3.8+
CUDA 11.7+ (如需GPU加速)
vLLM 0.2.0+
Chainlit 1.0.0+

3. 部署步骤

3.1 模型下载与准备

# 创建工作目录 mkdir -p /root/workspace/phi3_vision cd /root/workspace/phi3_vision # 下载模型权重 wget https://example.com/phi3-vision-128k-instruct.tar.gz tar -xzvf phi3-vision-128k-instruct.tar.gz

3.2 使用vLLM部署模型

# 启动vLLM服务 python -m vllm.entrypoints.api_server \ --model /root/workspace/phi3_vision \ --tensor-parallel-size 1 \ --gpu-memory-utilization 0.9 \ --max-num-seqs 256 \ --served-model-name phi3-vision-128k-instruct \ > /root/workspace/llm.log 2>&1 &

3.3 验证部署状态

# 查看服务日志 cat /root/workspace/llm.log

成功部署后，日志中应显示类似以下内容：

Uvicorn running on http://0.0.0.0:8000 Model loaded successfully

4. Chainlit前端集成

4.1 安装Chainlit

pip install chainlit

4.2 创建前端应用

新建app.py文件：

import chainlit as cl from typing import Dict, Optional import aiohttp import base64 @cl.on_chat_start async def on_chat_start(): await cl.Message(content="Phi-3 Vision 128K Instruct 已就绪，可以开始图文对话").send() @cl.on_message async def on_message(message: cl.Message): if not message.elements: await cl.Message(content="请上传图片并提问").send() return image = message.elements[0] image_data = base64.b64encode(image.content).decode("utf-8") async with aiohttp.ClientSession() as session: async with session.post( "http://localhost:8000/v1/chat/completions", json={ "model": "phi3-vision-128k-instruct", "messages": [ { "role": "user", "content": [ {"type": "text", "text": message.content}, {"type": "image_url", "image_url": f"data:image/jpeg;base64,{image_data}"} ] } ], "max_tokens": 2048 } ) as resp: response = await resp.json() await cl.Message(content=response["choices"][0]["message"]["content"]).send()

4.3 启动前端服务

chainlit run app.py -w

5. 使用验证

5.1 访问前端界面

在浏览器中打开Chainlit提供的本地地址（通常是http://localhost:8000）

5.2 进行图文对话测试

上传一张图片
输入问题，例如："图片中是什么？"
等待模型分析并返回结果

成功响应示例：

这是一张城市街景照片，画面中有多栋现代建筑、人行道和树木。前景可见几位行人正在过马路，背景有蓝天和少量云朵。

6. 常见问题解决

6.1 模型加载失败

可能原因：

显存不足
模型路径错误

解决方案：

检查GPU显存使用情况
确认模型路径是否正确

6.2 前端无响应

可能原因：

vLLM服务未启动
端口冲突

解决方案：

检查vLLM服务状态
确认端口8000未被占用

6.3 图片识别不准确

可能原因：

图片质量差
问题描述不清晰

解决方案：

提供清晰图片
使用更具体的问题描述

7. 总结

本教程详细介绍了在国产信创环境下使用vLLM部署Phi-3-Vision-128K-Instruct多模态模型，并通过Chainlit构建图文对话前端的完整流程。该方案具有以下优势：

高效部署：利用vLLM实现高性能模型服务
易用交互：通过Chainlit提供友好的用户界面
国产适配：已验证在国产信创环境的兼容性
多模态支持：实现图文理解和对话能力

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

查看全文

http://www.jsqmd.com/news/492712/

告别白边！Windows窗口自定义的终极指南：保留阴影+可拖动+可调整大小

STK航空仿真：坐标系选择与转换实战指南

Qwen3-14B-Int4-AWQ入门：Python环境快速配置与模型调用第一行代码

【软件开发】在Ubuntu 18.04虚拟机上快速部署Python 3.12.2开发环境

Mathcad实战：LLC谐振电路公式推导全流程（附完整计算步骤）

STM32定时器输入捕获实战：从HAL库配置到精准脉宽与频率测量

Lingbot-Depth-Pretrain-ViTL-14 生成高质量深度图集：涵盖四大类经典视觉数据集

从DAGGER到DAD：模仿学习中的数据聚合技术演进与最新应用案例

基于OpenCV与GStreamer的CUDA加速视频处理实战指南

GB28181协议实战：5分钟搞定NVR/IPC接入视频监控平台（附常见错误排查）

Storm扩展开发：自定义组件实现特定大数据处理需求

2026年别再乱买降AI工具了！这3款才是论文党首选 - 还在做实验的师兄

【gmid设计实战】弱反型区Cdd自加载：从理论到迭代收敛的尺寸确定

从零开始：用vSphere Client在ESXi上部署CentOS6.5的完整避坑指南

VS Code终端显示行数不够用？教你一键修改到20000行（附详细截图）

2026年SCI论文降AI率用什么工具？实测5款后选了这个 - 还在做实验的师兄

Vue3实战：用vue-pdf-embed打造企业级PDF预览组件（含Ctrl+滚轮缩放技巧）

深入浅出Lingbot-Depth-Pretrain-ViTL-14背后的卷积神经网络与ViT原理

告别3D打印格式兼容难题：Blender3mfFormat插件的全方位解决方案

DeOldify跨平台开发初探：.NET桌面应用集成

Nano-Banana开源可部署优势：私有化部署保障产品图纸数据安全

YOLOE-v8l文本提示进阶：支持中文提示词与多语言混合输入方法

Step3-VL-10B-Base模型解释性研究：注意力可视化技术

Dify Rerank插件下载即失效？紧急发布：2024Q3最新兼容矩阵（支持v0.8.3–v1.1.0）、SHA256校验清单及回滚快照包（仅限72小时内领取）

Phi-3-vision-128k-instruct惊艳作品：室内设计图→软装搭配建议→预算分项清单生成

Python+Ollama构建本地AI文档分析流水线：从PDF智能解析到结构化Excel输出

【C++】深入解析日志框架调用链

2026年03月16日全球AI前沿动态

SUNFLOWER MATCH LAB在STM32嵌入式设备上的轻量化部署实践

Phi-3-mini-128k-instruct多轮对话连贯性展示：技术方案讨论实录

Phi-3-vision-128k-instruct部署教程：vLLM + Chainlit 在国产信创环境验证

1. 模型简介

2. 环境准备

2.1 硬件要求

2.2 软件依赖

3. 部署步骤

3.1 模型下载与准备

3.2 使用vLLM部署模型

3.3 验证部署状态

4. Chainlit前端集成

4.1 安装Chainlit

4.2 创建前端应用

4.3 启动前端服务

5. 使用验证

5.1 访问前端界面

5.2 进行图文对话测试

6. 常见问题解决

6.1 模型加载失败

6.2 前端无响应

6.3 图片识别不准确

7. 总结

相关文章：