当前位置：首页 > news >正文

Qwen3-VL:30B开源大模型应用：飞书审批流中自动识别合同截图并标出风险条款

news 2026/7/2 10:02:56

Qwen3-VL:30B开源大模型应用：飞书审批流中自动识别合同截图并标出风险条款

1. 项目概述与价值

在现代企业办公中，合同审批是每个法务和业务人员都要面对的重要环节。传统的合同审核流程往往需要人工逐条阅读，耗时耗力且容易遗漏关键风险点。特别是当合同以截图形式出现在飞书审批流中时，审核人员需要下载图片、放大查看、手动标注，整个过程效率低下。

本项目通过CSDN星图AI云平台，零基础教你私有化部署最强的多模态大模型Qwen3-VL:30B，并通过Clawdbot搭建一个既能"看图"又能"聊天"的飞书智能办公助手。这个助手能够自动识别飞书审批流中的合同截图，智能分析合同内容，并标出潜在的风险条款，大幅提升合同审核效率。

核心价值：

效率提升：合同审核从小时级降到分钟级
风险防控：AI智能识别潜在风险条款，减少人工遗漏
成本节约：减少专业法务人员的时间投入
无缝集成：直接接入飞书办公流程，无需改变现有工作习惯

实验说明：本文所有的部署及测试环境均由CSDN星图AI云平台提供。我们使用官方预装的Qwen3-VL-30B镜像作为基础环境进行二次开发。

1.1 硬件环境概览

GPU驱动	CUDA版本	显存	CPU	内存	系统盘	数据盘
550.90.07	12.4	48GB	20核心	240GB	50GB	40GB

2. 基础镜像选配与连通性测试

2.1 社区镜像选配

为了获得顶级的多模态交互体验，我们选择目前最强的VL-30B模型进行服务部署。这个模型特别适合处理合同识别这种需要同时理解图像和文本的复杂任务。

快速定位技巧：若镜像列表较长，建议直接通过搜索框输入关键字Qwen3-vl:30b快速锁定目标镜像

2.2 镜像部署配置

Qwen3-VL-30B属于高参数量的多模态大模型，对算力资源要求较高。官方推荐配置为48G显存。在星图平台创建实例时，直接按照默认推荐的配置框选择启动即可，平台会自动匹配最适合的硬件资源。

2.3 镜像可用性测试

实例开机后，返回个人控制台。点击Ollama控制台快捷方式，即可直接进入预装好的Ollama多模态Web交互页面。

2.3.1 Ollama交互页面测试

在Web界面进行初步对话，确保模型推理功能正常。可以上传一张简单的合同截图测试模型的图像理解能力。

2.3.2 本地API调用测试

由于星图云会为每个算力Pod提供公网URL，我们可以直接在本地通过Python调用API接口进行更深入的测试。

注意：请将base_url替换为您服务器实际对应的公网URL（格式如下所示）。

from openai import OpenAI client = OpenAI( # 将gpu-pod697b0f1855ba5839425df6ea-11434切换成您实际部署的服务器地址 base_url="https://gpu-pod697b0f1855ba5839425df6ea-11434.web.gpu.csdn.net/v1", api_key="ollama" ) def test_contract_analysis(image_url, contract_text): """ 测试合同分析功能 """ try: messages = [ { "role": "user", "content": [ {"type": "text", "text": "请分析这个合同截图，识别其中的风险条款并解释风险点"}, {"type": "image_url", "image_url": {"url": image_url}} ] } ] response = client.chat.completions.create( model="qwen3-vl:30b", messages=messages, max_tokens=1000 ) analysis_result = response.choices[0].message.content print("合同分析结果:") print(analysis_result) return analysis_result except Exception as e: print(f"分析失败: {e}") return None # 测试调用 if __name__ == "__main__": # 这里可以替换为实际的合同截图URL test_image_url = "https://example.com/contract-screenshot.png" test_contract_analysis(test_image_url, "")

3. Clawdbot的安装与初始化

3.1 安装Clawdbot

星图云环境已预装最新的Node.js并配置了镜像加速。我们推荐通过官方npm方式快速全局安装Clawdbot，这是连接飞书和AI模型的关键桥梁。

npm i -g clawdbot

3.2 启动并完成初始配置

执行以下命令开启向导模式。对于大多数进阶配置，我们先选择跳过，后续直接在Web控制面板中修改，这样更灵活。

clawdbot onboard

配置过程会引导你完成基本设置，包括选择部署模式、网络配置等关键参数。

3.3 启动网关并访问控制页面

Clawdbot默认管理端口为18789，启动后可以通过Web界面进行详细配置。

clawdbot gateway

访问地址示例：

# 原链接（8888端口）：https://gpu-pod697b0f1855ba5839425df6ea-8888.web.gpu.csdn.net/ # Clawdbot控制台链接（更换为18789端口）： https://gpu-pod697b0f1855ba5839425df6ea-18789.web.gpu.csdn.net/

4. 网络调优与安全配置

4.1 解决Web页面空白问题

故障原因：Clawdbot默认监听127.0.0.1，导致外部公网请求无法响应。我们需要修改配置实现全局监听，并配置可信代理。

修改前的监听状态：

修改配置文件：

vim ~/.clawdbot/clawdbot.json

核心配置项修改：

bind: 由loopback改为lan（开启全网监听）
auth.token: 自定义安全Token（例如：csdn）
trustedProxies: 添加0.0.0.0/0（信任所有代理转发）

"gateway": { "mode": "local", "bind": "lan", "port": 18789, "auth": { "mode": "token", "token": "csdn" }, "trustedProxies": ["0.0.0.0/0"], "controlUi": { "enabled": true, "allowInsecureAuth": true } }

修改后的监听状态：

4.2 配置控制面板访问凭证

刷新页面后，若系统提示缺失Token，请前往Overview页面填写刚才在.json文件中设置的csdn。

5. 核心集成：接入星图云私有化Qwen3-VL:30B

确认本地Ollama服务工作正常后，我们需要将Clawdbot的默认模型指向我们部署的30B大模型，这样飞书机器人就能使用这个强大的多模态模型了。

5.1 修改Clawdbot模型供应配置

编辑~/.clawdbot/clawdbot.json，在models.providers中添加my-ollama供应源，并更新agents默认模型为qwen3-vl:30b。

关键配置片段：

"models": { "providers": { "my-ollama": { "baseUrl": "http://127.0.0.1:11434/v1", "apiKey": "ollama", "api": "openai-completions", "models": [ { "id": "qwen3-vl:30b", "name": "Local Qwen3 30B", "contextWindow": 32000 } ] } } }, "agents": { "defaults": { "model": { "primary": "my-ollama/qwen3-vl:30b" } } }

5.2 完整配置文件参考

您可以直接复制以下JSON内容覆盖本地~/.clawdbot/clawdbot.json（请根据实际需要微调路径）：

{ "meta": { "lastTouchedVersion": "2026.1.24-3", "lastTouchedAt": "2026-01-29T09:43:42.012Z" }, "wizard": { "lastRunAt": "2026-01-29T09:43:41.997Z", "lastRunVersion": "2026.1.24-3", "lastRunCommand": "onboard", "lastRunMode": "local" }, "auth": { "profiles": { "qwen-portal:default": { "provider": "qwen-portal", "mode": "oauth" } } }, "models": { "providers": { "my-ollama": { "baseUrl": "http://127.0.0.1:11434/v1", "apiKey": "ollama", "api": "openai-completions", "models": [ { "id": "qwen3-vl:30b", "name": "Local Qwen3 32B", "reasoning": false, "input": [ "text" ], "cost": { "input": 0, "output": 0, "cacheRead": 0, "cacheWrite": 0 }, "contextWindow": 32000, "maxTokens": 4096 } ] } } }, "agents": { "defaults": { "model": { "primary": "my-ollama/qwen3-vl:30b" }, "models": { "my-ollama/qwen3-vl:30b": { "alias": "qwen" } }, "workspace": "/root/clawd", "compaction": { "mode": "safeguard" }, "maxConcurrent": 4, "subagents": { "maxConcurrent": 8 } } }, "messages": { "ackReactionScope": "group-mentions" }, "commands": { "native": "auto", "nativeSkills": "auto" }, "gateway": { "port": 18789, "mode": "local", "bind": "lan", "controlUi": { "enabled": true, "allowInsecureAuth": true }, "auth": { "mode": "token", "token": "csdn" }, "trustedProxies": [ "0.0.0.0/0" ] }, "skills": { "install": { "nodeManager": "npm" } } }