当前位置：首页 > news >正文

OpenClaw开源贡献：为Qwen3-VL:30B开发飞书技能并提交社区

news 2026/6/30 7:27:16

OpenClaw开源贡献：为Qwen3-VL:30B开发飞书技能并提交社区

1. 为什么选择为OpenClaw开发飞书技能

去年第一次接触OpenClaw时，我就被它的设计理念吸引了——一个真正能在本地运行的AI智能体框架。当时我正在寻找能够将大模型能力与日常办公场景结合的工具，而OpenClaw恰好提供了这样的可能性。

在星图平台部署了Qwen3-VL:30B模型后，我发现虽然模型能力很强，但实际办公场景中还是需要更具体的功能集成。特别是飞书作为我们团队的主要协作工具，如果能直接通过对话调用模型能力，工作效率会有质的提升。这就是我决定开发飞书技能的初衷。

2. 开发前的准备工作

2.1 环境配置

首先需要确保开发环境正确配置。我在星图平台选择了"Clawdbot+Qwen3-VL:30B"的预置镜像，这省去了大量基础环境搭建的时间。关键配置步骤如下：

# 检查OpenClaw版本 openclaw --version # 安装开发者工具包 npm install -g @openclaw/devkit # 创建技能开发目录 clawhub init feishu-qwen-skill --template=typescript

2.2 飞书开发者账号申请

开发飞书技能需要先在飞书开放平台注册开发者账号并创建应用。这里有几个关键点需要注意：

选择"企业自建应用"而非"商店应用"
记录下App ID和App Secret
配置权限时至少需要"获取用户信息"和"发送消息"权限
设置IP白名单时，需要添加星图平台实例的公网IP

3. 技能开发实战过程

3.1 技能架构设计

我设计的飞书技能主要实现三个核心功能：

多模态问答：支持用户上传图片并获取Qwen3-VL:30B的解析结果
文档摘要：自动处理飞书文档链接并生成摘要
会议纪要生成：解析飞书日历事件并生成会议要点

技能采用TypeScript开发，整体架构分为三层：

接口层：处理飞书Webhook事件
业务层：调用Qwen3-VL:30B模型API
展示层：格式化返回结果

3.2 核心代码实现

最关键的模型调用部分代码如下：

async function callQwenVL(prompt: string, imageUrl?: string) { const response = await fetch('http://localhost:18789/v1/chat/completions', { method: 'POST', headers: { 'Content-Type': 'application/json', 'Authorization': `Bearer ${process.env.OPENCLAW_API_KEY}` }, body: JSON.stringify({ model: "qwen3-vl-30b", messages: [ { role: "user", content: [ { type: "text", text: prompt }, ...(imageUrl ? [{ type: "image_url", image_url: { url: imageUrl } }] : []) ] } ], max_tokens: 2048 }) }); return response.json(); }

3.3 飞书交互实现

飞书的卡片消息交互是开发中的难点。需要特别注意：

消息卡片需要符合飞书的交互规范
图片上传需要先转存到飞书服务器
异步任务需要正确处理回调

// 处理图片消息示例 app.message(async ({ message }) => { if (message.message_type === 'image') { const imageKey = message.image_key; const imageUrl = await feishu.downloadImage(imageKey); const analysis = await callQwenVL("请描述这张图片的内容", imageUrl); await feishu.reply(message.message_id, { msg_type: "interactive", card: createAnalysisCard(analysis) }); } });

4. 本地测试与调试

开发过程中最大的挑战是调试飞书与OpenClaw的交互。我总结了几点经验：

使用ngrok建立临时隧道，方便飞书回调
在OpenClaw日志中开启debug模式
对Qwen3-VL:30B的返回结果做后处理，避免超长响应

测试时发现的一个典型问题是模型响应时间较长，解决方案是：

// 添加超时处理和进度提示 app.message(async ({ message }) => { await feishu.reply(message.message_id, { text: "正在处理您的请求，请稍候..." }); try { const result = await Promise.race([ callQwenVL(prompt), new Promise((_, reject) => setTimeout(() => reject(new Error("Timeout")), 30000) ) ]); // 返回结果... } catch (error) { // 错误处理... } });

5. 提交到ClawHub社区

5.1 准备提交材料

ClawHub对技能提交有明确要求：

完整的README文档
清晰的技能描述
示例用法
许可证文件

我的提交目录结构如下：

feishu-qwen-skill/ ├── src/ ├── tests/ ├── README.md ├── package.json ├── skill.yaml └── LICENSE

5.2 审核流程

提交后经历了三轮审核：

代码规范检查（自动化）
功能测试（人工）
安全审查（人工）

审核中最常被问到的是权限控制问题。解决方案是在skill.yaml中明确定义所需权限：

permissions: - feishu:message.basic - feishu:message.group - feishu:calendar.event.read

5.3 上架后的优化

技能上架后，根据用户反馈做了几项重要改进：

添加了对话上下文记忆功能
优化了多模态输入的提示词
增加了错误处理的重试机制

6. 开发经验与建议

通过这次开发，我总结了几个关键经验：

从简单功能开始：先实现核心功能，再逐步扩展
充分利用OpenClaw的调试工具：openclaw logs命令非常有用
关注Token消耗：Qwen3-VL:30B的调用成本较高，需要优化提示词
社区协作很重要：在开发过程中，OpenClaw的Discord社区提供了很大帮助

对于想要参与OpenClaw生态开发的同行，我的建议是：

先从修改现有技能开始
仔细阅读开发文档
积极参与社区讨论
保持代码简洁和模块化

这次开发经历让我深刻体会到开源社区的力量。通过贡献一个具体的飞书技能，不仅解决了自己的办公需求，还能帮助到更多有类似场景的用户。OpenClaw的生态正在快速发展，期待看到更多开发者加入这个充满可能性的社区。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

查看全文

http://www.jsqmd.com/news/530968/

CoPaw结合YOLOv8实现智能图像分析：目标检测与内容理解实战

Sandboxie启动失败怎么办？3个诊断步骤+修复方案详解

使用Docker一键部署Qwen3-ASR语音识别服务

SecGPT-14B基础教程：安全问答Prompt工程——提升XSS识别准确率技巧

Jetson Xavier NX 系统镜像备份与迁移至SSD全攻略

cryptography - 安全地进行加密和解密

3步突破系统限制：老旧Windows设备的Python升级指南——让Windows 7焕发新活力的终极解决方案

Qwen3.5-4B-Claude-Opus部署案例：双卡RTX 4090D下GPU利用率优化实践

Python JSON 操作指南：4 个核心方法一文吃透

Phi-4-Reasoning-Vision实际作品：复杂流程图自动解析+执行路径推理生成

DFIG仿真：首先，给出了感应电机在dq域的详细数学模型然后，根据双馈风力发电机的特点，对一般...

G-Helper开源工具：华硕笔记本GameVisual色彩配置文件恢复完全指南

破解DEAP的3大实战密码：进化算法框架问题解决指南

Spec Kit：如何通过规范驱动开发终结传统软件开发的混乱

从Office到3D模型：kkFileView预览功能实战，如何用它快速搭建企业内部文档中心？

DeEAR语音情感识别完整指南：模型权重结构解析、中间层特征提取与可视化

SmolVLA作品集：Flow Matching训练目标下动作分布平滑性验证

6款降AI工具实测对比：价格效果全对比，最便宜的不一定最好

chinese-poetry：文化数字化传承的开放数据创新探索

C51单片机智能风扇语音识别开发指南：从硬件搭建到固件烧录

深入解析Linux中/usr/local的架构设计与最佳实践

用Pixhawk 2.4.8和Jetson Nano DIY一台能巡线避障的ROS无人车（保姆级硬件接线指南）

编写程序，让智能香烟检测仪检测烟雾时，室内新风系统自动启动提示，

Qwen-Image-Edit-F2P人脸生成教程：多角度人像生成策略与camera参数模拟技巧

如何用轻量级引擎实现资源受限环境下的动态计算？TinyExpr实战指南

【立煌】G101EVN01.3友达10.1寸LCD工业液晶显示屏幕规格参数

深度解析UPX可执行文件压缩技术：如何实现70%体积缩减与零性能损耗

Pixel Fashion Atelier企业落地：服装品牌用其快速生成复古像素风产品宣传图

SpacetimeGaussians 从入门到实践：实时动态视图合成解决方案