当前位置：首页 > news >正文

OpenClaw多模型统一调度：构建模型无关的AI工具链中枢

news 2026/6/22 17:13:34

1. 项目概述：一次配置，多模型协同——OpenClaw 的“智能中枢”式接入实践

你有没有遇到过这样的场景：刚在 OpenClaw 里调通了 Qwen 的本地推理，想试试 Claude 的代码生成能力，就得重装插件、改一堆环境变量；刚配好 DeepSeek 的 API 地址，切到另一个项目又得手动切换配置文件，一不小心就触发了api error: the model has reached its context window limit.这类报错？这不是你操作的问题，而是传统单模型绑定架构的天然缺陷。OpenClaw 本身不是模型，它是一个可编程的 AI 工具链调度器——就像电脑的操作系统不生产 CPU，但它决定了哪块芯片在什么时间、以什么优先级处理哪类任务。本项目标题里的“一次接入多个模型”，核心不在“连上”，而在于构建一套模型无关、协议统一、路由可控、上下文隔离的运行时抽象层。我实测下来，这套方案让我的日常开发流从“每换一个模型就要重启一次工作流”变成“在同一个命令行窗口里，用openclaw --model claude --task code-review和openclaw --model qwen --task image-describe无缝切换”，中间不需要 reload、不需要改 config、甚至不需要等模型加载。它特别适合三类人：一是需要横向对比不同模型能力（比如测试 Qwen-3.5 在数学推理 vs DeepSeek-V4 在代码补全上的 token 效率）的技术选型者；二是正在搭建内部 AI 辅助平台的 DevOps 工程师，要求模型增减不影响前端调用逻辑；三是像我这样习惯用 CLI 快速验证想法的重度终端用户。关键词里反复出现的api,codex配置第三方api,openclaw配置都指向同一个痛点：API 接入不该是“硬编码”，而应是“可声明、可编排、可灰度”的基础设施能力。

2. 整体设计思路与架构选型：为什么不是简单写个 for 循环？

2.1 拒绝“胶水脚本”：从需求倒推架构分层

看到标题，很多人第一反应是：“不就是写个 Python 脚本，把三个模型的 API 请求封装成函数，再加个 if-else 分发？”这确实能跑通，但很快会撞墙。我试过这种“胶水脚本”方案，在接入第四个模型（Llama-3.2）后，问题集中爆发：

上下文污染：Qwen 的 system prompt 里写了You are a helpful assistant who speaks Chinese，Claude 的 prompt 却是Respond in English only，如果共用一个全局 prompt 变量，每次调用前都得手动 reset，漏一次就导致输出语言错乱；
参数失配：DeepSeek 的max_tokens参数实际限制的是输出长度，而 Qwen 的max_new_tokens是生成新 token 的上限，Claude 的max_tokens却是输入+输出总和——这三个参数名字相似，语义却完全不同，硬塞进一个--max-tokens命令行参数必然出错；
错误处理割裂：api error: claude's response exceeded the 32000 output token maximum.这种错误只对 Claude 有意义，Qwen 根本没有这个限制，但胶水脚本里所有模型共享同一套 try-except，结果 Qwen 报ConnectionError时，日志里却打印出 “Claude 输出超限”，排查成本翻倍。

所以，真正的设计起点不是“怎么连”，而是“怎么让每个模型活成独立个体”。我最终采用的三层架构是：适配器层（Adapter）→ 路由层（Router）→ 统一接口层（CLI/API）。适配器层为每个模型定制“翻译官”，把 OpenClaw 的通用指令（如--task code-gen）翻译成该模型专属的 HTTP body、header 和 error 处理逻辑；路由层不关心模型细节，只根据--model参数值查表，把请求精准投递给对应适配器；统一接口层则完全屏蔽底层差异，用户看到的永远是openclaw --model <name> --input <text>这种干净命令。这个设计直接解决了热搜词里高频出现的openclaw配置和codex配置第三方api的本质矛盾：配置不是写死的字符串，而是可插拔的模块。

2.2 为什么选 OpenClaw 而非直接调用 API？

有人会问：既然都要写适配器，为什么不直接用curl或requests调各模型 API？这就涉及到 OpenClaw 的不可替代性。它的核心价值在于状态管理和技能编排。举个真实例子：我要让 AI 完成“分析 GitHub PR 的代码变更并生成中文 review 意见”。纯 API 调用需要：1）用 Qwen 解析 diff 文本；2）把解析结果喂给 Claude 写 review；3）再用 DeepSeek 检查是否存在安全漏洞。这三个步骤之间有强依赖，且第二步的输入必须是第一步的结构化输出。OpenClaw 的skill机制允许我把这三步定义为一个pr-review技能，其中step1: model=qwen, task=diff-parse→step2: model=claude, task=review-write, input=step1.output→step3: model=deepseek, task=security-scan, input=step2.output。这种跨模型的 pipeline 编排，是任何单点 API 调用无法实现的。这也是为什么热搜词里openclaw skill和claude code skill总是成对出现——Skill 不是功能，而是工作流的 DNA。

2.3 模型选型背后的工程权衡：Claude、Qwen、DeepSeek 各自的“脾气”

接入不是拍脑袋决定的，每个模型的特性直接决定了适配器的复杂度：

Claude（Anthropic）：它的messages数组格式严格要求role必须是user/assistant/system，且system角色只能出现在第一条消息。更麻烦的是它的流式响应（event: message-start）和普通 chunk 混合，如果适配器没做状态机解析，很容易把message-start当作有效文本返回。我实测发现，Claude 的max_tokens确实是输入+输出总和，当提示词（prompt）本身超过 28000 tokens 时，即使设置max_tokens=32000，也会直接报context window limit错误——这解释了热搜词里api error: the model has reached its context window limit.的根源。适配器必须在发送请求前，用tiktoken库预估 prompt 长度并动态截断。
Qwen（通义千问）：HuggingFace 上的Qwen2.5-7B-Instruct本地部署时，transformers库的pipeline默认不支持messages格式，必须手动拼接"<|im_start|>system\n{system}<|im_end|><|im_start|>user\n{user}<|im_end|><|im_start|>assistant\n"。而 Qwen 的 API 服务（如 vLLM 部署）又支持标准 OpenAI 格式。这意味着同一个 Qwen 模型，本地和云端适配器要写两套逻辑。我最终选择统一走 OpenAI 兼容 API 层，哪怕本地部署也用vllm serve --model Qwen2.5-7B-Instruct --enable-chunked-prefill启动，这样适配器就能复用。
DeepSeek（深度求索）：它的DeepSeek-VL多模态版本和DeepSeek-Coder代码版 API 参数差异极大。DeepSeek-Coder的temperature范围是0.0~2.0，而DeepSeek-VL要求0.1~1.0，超出就报400 thinking options type cannot be disabled when reasoning_effor这种晦涩错误。适配器必须为不同子型号内置参数校验规则。

这些细节不是文档里写的，是我踩着openclaw : 无法将“openclaw”项识别为 cmdlet这类报错，一条条console.log打印出来的。它们共同指向一个结论：多模型接入的本质，是管理“模型的个性”，而不是掩盖它们的差异。

3. 核心细节解析与实操要点：从零构建可扩展适配器体系

3.1 OpenClaw 环境准备：避开 Windows 下最坑的两个陷阱

OpenClaw 官方推荐用npm install -g openclaw全局安装，但在 Windows 上，这会导致openclaw命令在 PowerShell 中被识别为非法 cmdlet。根本原因不是权限问题，而是 Node.js 的.cmd扩展名注册冲突。我试过Set-ExecutionPolicy RemoteSigned、npm config set script-shell "C:\\Windows\\System32\\WindowsPowerShell\\v1.0\\powershell.exe"等十多种方案，最终发现最稳的解法是：放弃全局安装，改用 npx 本地调用。具体步骤：

新建项目目录mkdir openclaw-multi-model && cd openclaw-multi-model；
初始化npm init -y；
安装 OpenClaw 为开发依赖npm install --save-dev openclaw；
在package.json的"scripts"里添加"openclaw": "openclaw"；
以后所有命令都用npm run openclaw -- --model qwen --input "hello"。

这个方案绕过了 Windows 的 PATH 注册问题，且npx会自动查找本地 node_modules，比全局安装更可靠。另一个大坑是virtual machine platform not available claude's workspace requires the virtual machine platform。这其实是 WSL2 相关错误，但 Claude 官方桌面版并不依赖 WSL2。真正原因是你的 Windows 版本低于 22H2，或 BIOS 中的Virtualization Technology (VT-x/AMD-V)未开启。我建议直接使用 Claude 的 Web 版 API（https://api.anthropic.com/v1/messages），而非桌面版，因为 OpenClaw 适配的是 API，不是 GUI。

提示：不要在C:\Users\用户名\这种带中文路径的目录下初始化项目，Node.js 的某些依赖（如node-gyp）在中文路径下编译会失败，报错信息却是gyp ERR! stack Error: spawn C:\Windows\Microsoft.NET\Framework\v4.0.30319\msbuild.exe ENOENT，极具迷惑性。

3.2 适配器开发规范：每个模型一个独立模块，拒绝“上帝类”

OpenClaw 的适配器不是随意写的 JS 文件，它必须遵循src/adapters/<model-name>.ts的路径约定，并导出一个符合ModelAdapter接口的对象。以 Claude 适配器为例，其核心结构如下：

// src/adapters/claude.ts import { ModelAdapter, AdapterOptions } from 'openclaw'; export const claudeAdapter: ModelAdapter = { // 模型标识，必须与命令行 --model 参数值一致 id: 'claude', // 初始化时加载的配置，从 openclaw.config.json 读取 init: (config: AdapterOptions) => { return { apiKey: config.apiKey || process.env.ANTHROPIC_API_KEY, baseUrl: config.baseUrl || 'https://api.anthropic.com/v1', model: config.model || 'claude-3-5-sonnet-20241022' }; }, // 核心方法：把 OpenClaw 的通用请求，转换为 Claude API 的特定请求 request: async (input: string, options: any, adapterConfig: any) => { // 步骤1：预处理——检查 context window const encoder = await import('tiktoken'); const enc = encoder.getEncoding('claude-3'); const promptTokens = enc.encode(input).length; if (promptTokens > 28000) { input = enc.decode(enc.encode(input).slice(0, 28000)); // 强制截断 } // 步骤2：构造 Claude 特有的 messages 格式 const messages = [ { role: 'user', content: input } ]; // 步骤3：发起请求，注意 header 必须带 anthropic-version const res = await fetch(`${adapterConfig.baseUrl}/messages`, { method: 'POST', headers: { 'x-api-key': adapterConfig.apiKey, 'anthropic-version': '2023-06-01', 'content-type': 'application/json' }, body: JSON.stringify({ model: adapterConfig.model, messages, max_tokens: 4096, // Claude 的硬限制，不能设太大 temperature: options.temperature || 0.5 }) }); // 步骤4：错误处理——专治 Claude 的奇葩报错 if (!res.ok) { const errorData = await res.json(); if (errorData.error?.type === 'overload_error') { throw new Error(`Claude 服务过载，请稍后重试`); } if (errorData.error?.type === 'invalid_request_error' && errorData.error.message.includes('context window')) { throw new Error(`Claude 输入过长，已自动截断`); } throw new Error(`Claude API 错误: ${errorData.error?.message || res.status}`); } const data = await res.json(); return data.content[0].text; // 提取纯文本输出 } };

这个结构的关键在于：

init方法只做配置加载，不涉及网络请求，保证初始化快；
request方法是纯函数，输入input和options，输出string，不依赖外部状态，方便单元测试；
所有模型特有逻辑（如tiktoken截断、anthropic-versionheader）都封在request内，上层路由层完全无感。

Qwen 和 DeepSeek 的适配器同理，只是request方法里的 URL、body 结构、error 解析逻辑不同。这种模块化设计，让新增模型（比如下周要接入的glm-4）只需复制一个文件，改 3 处代码，5 分钟就能上线。

3.3 统一配置中心：用 openclaw.config.json 实现“一次配置，全局生效”

OpenClaw 的配置不是散落在各个适配器文件里，而是集中在一个openclaw.config.json文件中。这个文件是整个多模型体系的“心脏”，它的结构直接决定了扩展性：

{ "models": { "claude": { "apiKey": "sk-ant-api03-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx", "baseUrl": "https://api.anthropic.com/v1", "model": "claude-3-5-sonnet-20241022" }, "qwen": { "baseUrl": "http://localhost:8000/v1", "model": "Qwen2.5-7B-Instruct", "apiKey": "EMPTY" }, "deepseek": { "baseUrl": "https://api.deepseek.com/v1", "model": "deepseek-coder-33b-instruct", "apiKey": "sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx" } }, "defaults": { "temperature": 0.7, "maxRetries": 3 } }

这里有两个精妙设计：

models对象的键名（claude/qwen/deepseek）必须与适配器id字段完全一致。OpenClaw 的路由层就是靠这个键名去src/adapters/目录下找对应文件的。如果openclaw.config.json里写"claude3"，但适配器id是'claude'，就会报openclaw : 无法将“claude3”项识别为 cmdlet。
apiKey字段可以是明文，也可以是环境变量引用。对于本地部署的 Qwen（baseUrl: http://localhost:8000/v1），API Key 通常是"EMPTY"，这是 vLLM 的默认设定；而对于云端服务，我强烈建议用环境变量，比如"apiKey": "${ANTHROPIC_API_KEY}"，然后在启动时ANTHROPIC_API_KEY=xxx npm run openclaw -- --model claude ...。这样既安全，又避免密钥硬编码进 Git。

注意：openclaw.config.json必须放在项目根目录，且文件名不能带空格或特殊字符。我曾因文件名是openclaw config.json（带空格），导致 OpenClaw 读取失败，报错却是Error: Cannot find module 'openclaw'，浪费了 2 小时排查。

4. 实操过程与核心环节实现：从命令行到技能链的完整落地

4.1 命令行交互：让`openclaw --model`成为肌肉记忆

配置好适配器和 config 文件后，最直观的验证方式就是命令行。OpenClaw 的 CLI 设计非常务实，所有参数都直击痛点：

# 基础用法：指定模型和输入文本 npm run openclaw -- --model claude --input "用 Python 写一个快速排序" # 进阶用法：传递模型专属参数（这些参数会透传给适配器的 request 方法） npm run openclaw -- --model qwen --input "描述这张图片" --image "path/to/image.jpg" --temperature 0.3 # 批量处理：从文件读取输入，结果保存到文件 npm run openclaw -- --model deepseek --input-file "prompts.txt" --output-file "results.jsonl" # 查看模型状态（检查 API 是否连通） npm run openclaw -- --model claude --health-check

关键参数说明：

--input和--input-file：前者是字符串，后者是文件路径。--input-file会按行读取，每行一个 prompt，非常适合批量测试。
--image：Qwen-VL 和 DeepSeek-VL 支持多模态，这个参数会把图片 base64 编码后注入请求 body。Claude 适配器遇到--image会直接报错，因为 Claude 当前 API 不支持图片输入——这正是适配器隔离的价值：错误发生在模型层，不会污染整个系统。
--health-check：每个适配器必须实现healthCheck方法，它不走完整推理流程，只发一个轻量请求（如 Claude 的GET /v1/usage），用来快速验证 API Key 和网络连通性。

我实测下来，--health-check是日常运维的救命稻草。当api error: claude's response exceeded the 32000 output token maximum.频繁出现时，先跑一遍--health-check，如果通过，说明是 prompt 问题；如果不通过，立刻知道是 API Key 过期或网络故障，省去 80% 的无效排查。

4.2 技能（Skill）编排：把三个模型串成一条流水线

这才是 OpenClaw 多模型接入的高光时刻。我们以“技术文档生成”为例，构建一个tech-doc技能：

第一步：创建技能定义文件
在项目根目录新建skills/tech-doc.yaml：

name: tech-doc description: 从代码片段生成专业中文技术文档 steps: - id: parse-code model: qwen task: code-understand input: "{{ .input }}" output: parsed_ast # 此步骤的输出命名为 parsed_ast - id: write-doc model: claude task: doc-gen input: "基于以下代码结构，生成中文技术文档：{{ .parsed_ast }}" output: doc_content - id: polish model: deepseek task: doc-polish input: "润色以下技术文档，使其更专业、简洁：{{ .doc_content }}" output: final_doc output: "{{ .final_doc }}"

第二步：编写技能执行脚本
在src/skills/tech-doc.ts中实现各步骤的逻辑：

// src/skills/tech-doc.ts import { SkillExecutor } from 'openclaw'; export const techDocSkill: SkillExecutor = { name: 'tech-doc', execute: async (input: string) => { // 步骤1：调用 Qwen 解析代码 const parsedAst = await openclaw.request({ model: 'qwen', input: `请分析以下 Python 代码的函数签名、参数类型和返回值：${input}` }); // 步骤2：调用 Claude 生成初稿 const docContent = await openclaw.request({ model: 'claude', input: `你是一位资深 Python 文档工程师。请基于以下代码分析，生成一份专业的中文 Sphinx 文档，包含 :param: 和 :return: 标签。分析内容：${parsedAst}` }); // 步骤3：调用 DeepSeek 润色 const finalDoc = await openclaw.request({ model: 'deepseek', input: `你是一位技术文档编辑。请将以下文档润色为更专业、简洁的风格，删除冗余形容词，确保术语准确：${docContent}` }); return finalDoc; } };

第三步：调用技能

npm run openclaw -- --skill tech-doc --input "def fibonacci(n): ..."

这个技能链的价值在于：每个模型只做自己最擅长的事。Qwen 的代码理解能力在中文语境下极强；Claude 的文档生成结构严谨；DeepSeek 的润色让语言更精炼。三者叠加的效果，远超任何一个模型单打独斗。这也解释了为什么热搜词里qwen 分子分析和deepseek agent总是并存——它们不是竞争关系，而是协作关系。

4.3 日志与调试：读懂 OpenClaw 的“黑盒”输出

OpenClaw 默认日志很安静，但调试多模型问题时，你需要打开“透视眼”。在package.json的 scripts 里添加：

"openclaw:debug": "DEBUG=openclaw:* npm run openclaw"

然后运行：

npm run openclaw:debug -- --model qwen --input "test"

你会看到类似这样的输出：

openclaw:router Routing request to model 'qwen' +0ms openclaw:adapter:qwen Initializing adapter with config { baseUrl: 'http://localhost:8000/v1', model: 'Qwen2.5-7B-Instruct' } +0ms openclaw:adapter:qwen Sending request to http://localhost:8000/v1/chat/completions +5ms openclaw:adapter:qwen Request body: {"model":"Qwen2.5-7B-Instruct","messages":[{"role":"user","content":"test"}]} +1ms openclaw:adapter:qwen Response status: 200, took 1245ms +1245ms

这些日志清晰地展示了请求从路由层 → 适配器层 → 网络层的完整路径。当你遇到api error: 400 thinking options type cannot be disabled when reasoning_effor时，看日志就能定位到是 DeepSeek 适配器发出了非法参数；当openclaw命令报错找不到模块时，日志第一行Routing request to model 'xxx'就能确认是不是模型名拼错了。

实操心得：我习惯在src/adapters/每个适配器的request方法开头加一行console.debug([${model}] Raw input: ${input.substring(0, 100)}...);，这样一眼就能看出输入文本是否被意外截断或编码错误。这个小技巧帮我揪出了 70% 的“模型不工作”问题。

5. 常见问题与排查技巧实录：那些官方文档不会告诉你的坑

5.1 模型连接失败的四大元凶与速查表

现象	最可能原因	排查命令	解决方案
`openclaw : 无法将“openclaw”项识别为 cmdlet`	Windows PowerShell 的 Node.js 命令注册失败	`where openclaw`	改用`npx openclaw`或`npm run openclaw`（见 3.1 节）
`api error: the model has reached its context window limit.`	Claude 的 prompt 长度 > 28000 tokens	`npm run openclaw -- --model claude --health-check`	在适配器中加入`tiktoken`预截断（见 3.2 节代码）
`api error: claude's response exceeded the 32000 output token maximum.`	Claude 的`max_tokens`设置过大，且 prompt 本身很长	`curl -X POST https://api.anthropic.com/v1/messages -H "x-api-key: YOUR_KEY" -H "anthropic-version: 2023-06-01" -d '{"model":"claude-3-5-sonnet","messages":[{"role":"user","content":"a"}],"max_tokens":32000}'`	将`max_tokens`降低到`4096`，或在 prompt 中明确要求`请用不超过 200 字回答`
`Error: connect ECONNREFUSED 127.0.0.1:8000`	本地 Qwen 的 vLLM 服务未启动	`curl http://localhost:8000/health`	运行`python -m vllm.entrypoints.api_server --model Qwen2.5-7B-Instruct --host 0.0.0.0 --port 8000`

这个表格里的每一个条目，都是我连续三天熬夜 debug 后总结的。比如最后一行，vllm entrypoints api_server的模块路径在 vLLM 0.4.2 版本后从vllm.entrypoints.openai.api_server改成了vllm.entrypoints.api_server，旧教程里的命令直接失效，报错却是ModuleNotFoundError: No module named 'vllm.entrypoints.openai'，根本看不出是版本问题。

5.2 Token 计数的“俄罗斯套娃”：为什么你的 prompt 总是超限？

Token 计数是多模型接入里最反直觉的部分。你以为input.length就是 token 数？大错特错。不同模型的 tokenizer 完全不同：

Claude 用cl100k_base（和 GPT-3.5 一样），tiktoken.encoding_for_model("claude-3-5-sonnet-20241022")；
Qwen 用Qwen2Tokenizer，from transformers import AutoTokenizer; tok = AutoTokenizer.from_pretrained("Qwen/Qwen2-7B-Instruct"); len(tok.encode(text))；
DeepSeek 用DeepSeekTokenizer，同样需用transformers加载。

更坑的是，同一个文本，用不同 tokenizer 计数，结果可能差 2 倍。我测试过"Hello, 世界！"这个字符串：

Claude tokenizer：8 tokens（['Hello', ',', ' ', '世', '界', '！']）；
Qwen tokenizer：6 tokens（['Hello', ',', ' ', '世界', '！']）；
DeepSeek tokenizer：7 tokens（['Hello', ',', ' ', '世', '界', '！']）。

所以，适配器里绝对不能混用 tokenizer。Claude 适配器必须用tiktoken，Qwen 适配器必须用transformers，否则context window limit错误会像幽灵一样缠着你。我在src/utils/token-count.ts里封装了一个工厂函数：

export const getTokenCount = (modelId: string, text: string): number => { switch(modelId) { case 'claude': const enc = tiktoken.getEncoding('cl100k_base'); return enc.encode(text).length; case 'qwen': const qwenTok = AutoTokenizer.from_pretrained('Qwen/Qwen2-7B-Instruct'); return qwenTok.encode(text).length; case 'deepseek': const deepseekTok = AutoTokenizer.from_pretrained('deepseek-ai/deepseek-coder-33b-instruct'); return deepseekTok.encode(text).length; default: return text.length; // 保底 } };

这个函数被所有适配器调用，确保 token 计数的权威性。

5.3 性能优化实战：如何让三模型接力不卡顿？

多模型串联最大的体验问题是延迟。Qwen 本地推理 1.2 秒 + Claude API 2.3 秒 + DeepSeek API 1.8 秒 = 单次技能执行 5.3 秒，用户会觉得“卡”。我的优化策略是：

并行化非依赖步骤：如果技能链里有步骤 A 和 B 不互相依赖（比如 A 分析代码，B 分析日志），用Promise.all([stepA(), stepB()])并行执行，总耗时取最大值而非相加。
结果缓存：对重复的input，用sha256(input)作为 key，把结果存在 Redis 里。我加了一行const cacheKey = createHash('sha256').update(input).digest('hex');，缓存命中率高达 65%，平均延迟降到 1.8 秒。
流式响应：OpenClaw 支持--stream参数，适配器可以用ReadableStream返回 chunk。Claude 的流式响应需要解析event: content-block-delta，我写了专用的 parser，让用户看到.逐个出现，心理等待时间大幅缩短。

这些优化不是理论，是我在给团队做内部 AI 平台时，被产品经理追着改了 7 个版本才定下来的。现在我们的tech-doc技能，90% 的请求能在 2 秒内返回首字节，用户反馈“比以前快多了”。

6. 拓展与演进：从多模型接入到 AI 工作流操作系统

做到“一次接入多个模型”，只是起点。OpenClaw 的真正潜力，在于它能把模型变成工作流的“原子操作符”。比如，我可以定义一个git-pr-automate技能：

step1: model=qwen, task=diff-parse, input={{ git diff }}→ 提取变更的函数名；
step2: model=claude, task=test-gen, input="为函数 {{ .functions }} 生成单元测试"→ 生成 pytest 代码；
step3: model=deepseek, task=code-exec, input="执行以下 Python 代码：{{ .tests }}"→ 在沙箱里运行测试并返回结果；
step4: model=qwen, task=report-gen, input="汇总以下测试结果：{{ .exec_result }}"→ 生成中文报告。

这个技能链，本质上是在用 AI 模拟一个资深工程师的 PR Review 流程。而 OpenClaw 就是那个调度员，它不关心每个模型怎么工作，只关心“谁在什么时候，做什么事”。

这也解释了为什么热搜词里deepseek agent和openclaw skill总是同时出现——Agent 不是某个模型的专利，而是 OpenClaw 这种调度框架赋予所有模型的能力。当你把--model参数从命令行移到 YAML 配置里，再把技能链封装成 Docker 镜像，你就拥有了一个可部署、可编排、可监控的 AI 工作流操作系统。

我个人在实际操作中的体会是：别把 OpenClaw 当成“另一个 ChatGPT 客户端”，而要把它当成“AI 时代的 Makefile”。Makefile 里写gcc -o hello hello.c，OpenClaw 里写--model qwen --task code-gen。差别只在于，后者操作的对象是智能体，而不是二进制。

查看全文

http://www.jsqmd.com/news/1062473/