当前位置：首页 > news >正文

OpenClaw技能开发：为Phi-3-mini-128k-instruct编写自定义插件

news 2026/7/22 13:05:28

OpenClaw技能开发：为Phi-3-mini-128k-instruct编写自定义插件

1. 为什么需要自定义技能

去年夏天，当我第一次尝试用OpenClaw自动化处理日报时，发现现有的技能库无法满足我对Phi-3模型特定参数的调用需求。这促使我走上了开发自定义技能的道路——不是所有需求都能用现成方案解决，特别是在处理专业领域任务时。

为Phi-3-mini-128k-instruct开发插件，本质上是在OpenClaw生态中创建一个"专属接口层"。这个中间层需要完成三件事：

将模型的特殊参数（如temperature=0.7）封装成易用的函数
声明操作权限边界（比如是否允许读写文件）
提供自然语言交互的元数据描述

2. 开发环境准备

我的开发环境组合有些特别：在Windows 11 WSL2的Ubuntu 22.04中运行OpenClaw，通过VS Code远程连接开发。这种混合环境恰好能验证跨平台兼容性。

核心工具链：

# 基础环境 node -v # 需v18+ npm install -g @openclaw/cli claw --version # Phi-3模型服务验证 curl -X POST http://localhost:8000/v1/completions \ -H "Content-Type: application/json" \ -d '{"model": "phi-3-mini-128k-instruct", "prompt": "你好"}'

遇到第一个坑是模型服务的CORS限制。解决方案是在启动vLLM时添加参数：

python -m vllm.entrypoints.api_server \ --model microsoft/Phi-3-mini-128k-instruct \ --cors-allow-origins "*"

3. 创建技能脚手架

OpenClaw的CLI工具提供了标准的脚手架生成器。执行以下命令会创建一个包含基础结构的技能模板：

claw skill create phi3-helper \ --author "yourname" \ --description "Phi-3-mini专用技能包" \ --category "llm-integration"

生成的核心文件结构如下：

phi3-helper/ ├── package.json ├── skill.json # 技能元数据 ├── src/ │ ├── index.ts # 主入口 │ ├── api/ # API封装层 │ └── types.ts # 类型定义 └── test/ └── basic.test.ts

特别要注意skill.json中的capabilities声明。对于Phi-3这种长上下文模型，我建议这样配置：

{ "runtime": { "maxContextLength": 131072, "requiredProviders": ["phi3-mini"] }, "permissions": { "files": "read", "network": true } }

4. 封装模型API

Phi-3-mini-128k-instruct有两个特性需要特别处理：

对系统消息的敏感度较高
需要显式设置stop_sequences

在src/api/phi3.ts中，我封装了这样的调用逻辑：

interface Phi3Params { systemPrompt?: string userMessage: string stopSequences?: string[] } export async function callPhi3(params: Phi3Params) { const response = await fetch('http://localhost:8000/v1/completions', { method: 'POST', headers: { 'Content-Type': 'application/json' }, body: JSON.stringify({ model: 'phi-3-mini-128k-instruct', prompt: formatMessages(params), stop: params.stopSequences || ['\n\n', '<|end|>'], max_tokens: 4096 }) }) if (!response.ok) throw new Error(`API Error: ${response.status}`) return (await response.json()).choices[0].text } function formatMessages(params: Phi3Params) { return [ params.systemPrompt || '你是一个乐于助人的AI助手', `用户: ${params.userMessage}`, '助手:' ].join('\n') }

实际测试时发现，直接返回原始API响应并不友好。于是在src/index.ts添加了结果标准化处理：

export default { name: 'phi3-helper', actions: { async chat(ctx, userInput: string) { try { const raw = await callPhi3({ userMessage: userInput, systemPrompt: ctx.config.systemPrompt }) return { success: true, data: { response: raw.replace(/助手:/g, '').trim(), tokens: raw.length / 4 // 近似估算 } } } catch (error) { return { success: false, error: error.message } } } } }

5. 本地测试与调试

开发过程中最耗时的部分是调试权限系统。OpenClaw的安全沙箱会阻止未声明的操作，比如：

尝试读取~/Documents目录
访问非白名单的URL

我的调试方法是在测试环境开启详细日志：

OPENCLAW_LOG_LEVEL=debug claw gateway start

遇到权限拒绝时，需要分三步处理：

在skill.json中添加对应权限声明
重新加载技能：claw skill reload phi3-helper
用户需在控制台二次确认授权

一个实用的测试脚本示例：

// test/basic.test.ts import { callPhi3 } from '../src/api/phi3' describe('Phi3 API', () => { it('should handle multi-turn conversation', async () => { const res1 = await callPhi3({ userMessage: 'Python的GIL是什么？' }) expect(res1).toContain('全局解释器锁') const res2 = await callPhi3({ userMessage: '它有什么优缺点？', stopSequences: ['。'] // 测试提前终止 }) expect(res2.length).toBeLessThan(100) }) })

6. 发布到ClawHub生态

完成开发后，发布流程比想象中简单。首先需要在ClawHub官网创建开发者账号，然后执行：

clawhub login clawhub publish --skill-dir ./phi3-helper

发布时需要注意几个关键点：

版本号遵循semver规范
package.json中的keywords要包含"phi-3"
必须提供至少3个使用示例

我的package.json关键配置如下：

{ "name": "@yourname/phi3-helper", "version": "0.1.0", "keywords": [ "phi-3", "llm", "openclaw", "128k" ], "examples": [ "问phi3: 解释量子计算基础", "问phi3 --system '你是个严厉的导师' 这段代码有什么问题", "问phi3 --stop '。' 用一句话说明" ] }

7. 持续迭代建议

上线后收到用户反馈，促使我做了三次重要更新：

添加流式响应支持
内置常见prompt模板
增加温度参数控制

流式响应的实现最有挑战性，需要修改网关的WebSocket处理逻辑。核心改动在src/api/stream.ts：

export function createPhi3Stream(params: Phi3Params) { const es = new EventSource( `http://localhost:8000/v1/completions?stream=true`, { body: JSON.stringify({ model: 'phi-3-mini-128k-instruct', prompt: formatMessages(params), stream: true }) } ) return new ReadableStream({ start(controller) { es.onmessage = (event) => { const data = JSON.parse(event.data) controller.enqueue(data.choices[0].text) } es.onerror = () => controller.close() }, cancel() { es.close() } }) }

现在，这个技能已成为我在ClawHub上下载量最高的作品。整个过程让我深刻体会到：好的AI工具开发，不是在堆砌API调用，而是创造符合人类直觉的交互抽象层。