当前位置：首页 > news >正文

OpenClaw Zero Token：零成本调用主流大模型的统一网关部署与实战

news 2026/5/2 14:27:55

1. 项目概述：零成本调用主流大模型的统一网关

最近在折腾AI应用开发时，一个绕不开的痛点就是API调用成本。无论是ChatGPT、Claude还是国内的DeepSeek、Kimi，官方API的计费模式对于个人开发者或小团队来说，长期使用都是一笔不小的开销。更别提那些需要频繁测试不同模型效果的场景了，钱包真的遭不住。

正是在这种背景下，我发现了OpenClaw Zero Token这个项目。它的核心思路非常巧妙：既然各大AI服务商都提供了免费的网页版聊天界面，那为什么不直接“驾驶”浏览器去使用这些服务，从而绕过付费API呢？这个项目本质上是一个智能网关，它通过自动化浏览器操作，模拟真实用户登录和使用网页版AI的过程，并将这些能力封装成统一的API接口。这意味着，你只需要像普通用户一样，在浏览器里登录一次你的账号，后续就可以通过代码免费、无限次地调用这些大模型了。

我花了几天时间深度体验和部署了这个项目，它目前支持DeepSeek、Qwen（国际/国内版）、Kimi、Claude网页版、豆包、ChatGPT网页版、Gemini网页版、Grok、智谱GLM网页版、小米MiMo等十多个主流模型。最让我惊喜的是，其中11个模型还支持“工具调用”功能，这意味着AI不仅能聊天，还能根据你的指令执行本地搜索、读取文件、运行命令等操作，实用性直接拉满。

如果你是一名预算有限的独立开发者、AI爱好者，或者是一个需要横向对比多个模型能力的研究者，那么这个项目绝对值得你花时间了解一下。它把“薅羊毛”这件事做到了极致，而且是以一种高度工程化、可编程的方式。接下来，我将从原理、部署、实战到避坑，为你完整拆解这个“零令牌”方案的方方面面。

2. 核心原理与架构拆解

在开始动手之前，我们必须先搞清楚OpenClaw Zero Token到底是怎么工作的。理解其原理，不仅能帮你顺利部署，更能在遇到问题时快速定位根源。它的核心架构可以概括为“一个中心，三层联动”。

2.1 整体工作流：从浏览器到API

项目的核心思想是“桥接”。它在用户的本机或服务器上，建立了一个中间层服务。这个服务主要做三件事：

自动化浏览器管理：启动一个处于“调试模式”的Chrome浏览器实例。这个模式允许外部程序（如Playwright）通过Chrome DevTools Protocol连接并控制浏览器，模拟点击、输入、跳转等所有用户操作。
凭证捕获与复用：引导用户在这个受控的浏览器中登录各个AI服务的网站（如chat.deepseek.com）。登录过程中，项目会监听网络请求，精准抓取登录成功后服务器返回的认证信息，主要是Cookies和Authorization头中的Bearer Token。这些凭证被安全地保存在本地。
请求代理与转发：当你的应用程序通过HTTP API向OpenClaw网关发送一个聊天请求时，网关不会去调用昂贵的官方API，而是使用之前保存的凭证，直接向该AI服务的“网页版API”发起请求。这个“网页版API”通常就是网页聊天界面背后真正用于通信的接口。

以DeepSeek为例，其认证流程的微观视角如下：

步骤1：启动调试浏览器。项目通过脚本start-chrome-debug.sh启动Chrome，并指定一个远程调试端口（如9222）。同时，为这个浏览器实例分配一个独立的用户数据目录，用于持久化会话状态。
步骤2：用户手动登录。脚本会自动打开DeepSeek的登录页面，你需要像平常一样扫码或输入密码完成登录。这一步之所以需要人工，是因为大多数网站都有复杂的反机器人验证（如滑块、点选），自动化破解成本高且易被封禁。
步骤3：凭证捕获。在后台，Playwright通过CDP监听浏览器的所有网络请求。当登录成功，浏览器向chat.deepseek.com的API发送请求时，Playwright会拦截这个请求，并将其请求头中的Cookie字段和Authorization字段（如果存在）完整地提取出来。
步骤4：本地存储。提取到的凭证会被序列化，并保存到项目状态目录下的auth.json文件中。这个文件是加密的，且被.gitignore排除，确保不会意外泄露。
步骤5：模拟API调用。之后，当需要通过代码调用DeepSeek时，DeepSeekWebClient会读取本地的auth.json，将存储的Cookie和Bearer Token原样附加到HTTP请求中，直接调用DeepSeek网页聊天的后端接口。对于服务器来说，这个请求和真实用户在浏览器里发送的请求几乎没有区别。

2.2 项目架构分层解析

理解了核心流程，我们再从代码层面看看它的模块化设计。这有助于你后续进行自定义开发或故障排查。

[你的应用] (Web UI / CLI / HTTP Client) | | (统一API请求) v [OpenClaw Gateway] (运行在 localhost:3001) | | (路由与调度) v [Agent Core / PI-AI Engine] (处理逻辑、工具调用、会话管理) | | (选择提供商) v [Provider Layer] (提供商客户端层) | | (使用对应凭证发起请求) v [各大AI服务网页端] (chat.deepseek.com, chat.kimi.ai...)

网关层：这是对外的统一入口，提供了RESTful API（兼容OpenAI API格式）和WebSocket接口。你的所有请求都发到这里。
核心引擎层：负责解析请求、管理聊天上下文、处理流式响应。更重要的是，它集成了“工具调用”的中间件。当检测到用户消息中包含特定关键词（如“搜索一下”、“读取文件”），它会动态地在提示词中注入工具定义，引导AI模型以结构化格式回复，从而触发本地工具的执行。
提供商客户端层：这是项目最核心也最复杂的部分。每个支持的AI服务（如deepseek-web,claude-web）都对应一个独立的客户端模块。每个客户端都需要实现两个关键部分：
1. 认证模块：位于src/zero-token/providers/*-web-auth.ts。它包含了引导登录和捕获凭证的具体逻辑。虽然登录动作是手动的，但打开登录页、监听凭证、保存结果这一套流程是由这里定义的。
2. API客户端模块：位于src/zero-token/providers/*-web-client.ts。它负责构建符合该网站API格式的HTTP请求，处理响应，并将响应转换为统一的流式数据格式。由于每个网站的接口设计、参数命名、流式输出格式都不同，所以每个提供商都需要单独适配。
流处理层：位于src/zero-token/streams/。网页版AI的回复通常是Server-Sent Events或类似的长连接流。这一层负责解析这些原生数据流，将其拆解为一个一个的文本块（chunk），并通过SSE或WebSocket实时推送给前端。

2.3 “零令牌”方案的利与弊

在投入时间之前，我们必须客观地看待这种方案。

优势：

零成本：最直接的吸引力，完全省去了API费用。
高配额：使用网页版的免费额度，通常比免费API的限额更宽松或根本没有明确限制。
功能同步：能第一时间用到网页版上最新的模型和能力，而官方API可能有延迟。
工具调用：实现了论文级别的智能体能力，让AI不仅能说，还能做。

需要注意的局限性：

稳定性风险：你的行为本质上是在模拟用户，如果请求频率过高、模式过于规律，有可能触发服务商的反爬虫机制，导致临时封禁或要求验证。这不适合高并发、生产级的商业应用。
会话管理：网页登录的会话（Session）会过期，需要定期重新登录。项目正在开发自动刷新会话的功能，但目前仍需手动维护。
性能开销：相比直接调用轻量的API，需要维护一个浏览器实例，会占用更多内存和CPU资源。
合规性：你必须严格遵守每个服务的使用条款。将本项目用于学习、研究和合理的个人自动化是没问题的，但用于大规模爬取、滥用或商业盈利则可能违规。

3. 从零开始：环境准备与项目部署

理论部分已经足够，现在让我们动手，把项目跑起来。我将以macOS/Linux环境为例，Windows用户请务必使用WSL2，否则会遇到大量路径和依赖问题。

3.1 基础环境搭建

首先，确保你的系统满足以下最低要求：

Node.js >= 22.12.0：这是硬性要求，低版本会导致模块无法解析。建议使用nvm来管理Node版本。
pnpm >= 9.0.0：这个项目使用pnpm作为包管理器，其workspace和hoist特性对项目结构至关重要，不能用npm或yarn替代。
Chrome/Chromium浏览器：用于自动化操作。系统自带的或从官网安装的都可以。
Git：用于克隆代码。

步骤1：安装Node.js和pnpm如果你没有安装nvm，可以先用包管理器安装Node，再安装pnpm。

# 使用nvm安装并切换Node.js（推荐） curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.39.7/install.sh | bash # 重启终端后 nvm install 22.12.0 nvm use 22.12.0 # 安装pnpm npm install -g pnpm@9 pnpm --version # 确认版本 >= 9.0.0

步骤2：克隆项目并安装依赖打开终端，找一个合适的目录，执行以下命令：

git clone https://github.com/linuxhsj/openclaw-zero-token.git cd openclaw-zero-token pnpm install

这里有一个关键细节：pnpm install不仅会安装package.json里的依赖，还会根据项目内部的pnpm-workspace.yaml配置，处理好多个子包（如UI界面）之间的链接关系。如果这一步报错，通常是网络问题，可以尝试设置淘宝镜像：pnpm config set registry https://registry.npmmirror.com。

步骤3：构建项目依赖安装完成后，需要编译TypeScript代码和前端资源。

pnpm build pnpm ui:build

pnpm build：编译核心的TypeScript后端代码，输出到dist目录。
pnpm ui:build：构建基于Lit 3.x的前端Web界面，输出到ui/dist目录。

重要提示：务必使用pnpm build，而不是npm run build。项目的构建脚本是为pnpm优化的。

3.2 核心脚本详解与首次认证

项目提供了三个核心Shell脚本，它们串联起了从启动到使用的完整流程。理解每个脚本的作用，能让你在遇到问题时不再迷茫。

脚本1：start-chrome-debug.sh– 启动调试浏览器这个脚本的目的是启动一个可供Playwright控制的Chrome实例。

#!/bin/bash # 它会做以下几件事： # 1. 检查是否已有Chrome在调试端口运行，避免冲突。 # 2. 创建一个独立的Chrome用户数据目录（例如 .chrome-profile），用于保存登录状态。 # 3. 以远程调试模式启动Chrome，并打开多个标签页，分别指向不同AI服务的登录页。 # 4. 输出CDP连接地址，通常是 ws://127.0.0.1:9222/devtools/browser/... ./start-chrome-debug.sh

运行后，你会看到一个新的Chrome窗口弹出，并且已经打开了DeepSeek、Kimi、Claude等网站的标签页。请保持这个终端窗口打开，不要关闭它，否则浏览器进程会退出。

脚本2：onboard.sh webauth– 认证向导这是最关键的一步。在浏览器中手动完成各个网站的登录后，你需要在新终端中运行这个向导来捕获凭证。

# 在新终端中，进入项目目录执行 ./onboard.sh webauth

这个交互式脚本会：

列出所有支持的Web提供商。
让你选择想要配置哪一个（例如，输入deepseek-web）。
引导你完成该提供商的认证流程。它会尝试从正在运行的调试浏览器中读取凭证。如果检测到你尚未登录，它会提示你先去浏览器完成登录。
成功捕获凭证后，将其写入到.openclaw-zero-state/agents/main/agent/auth.json中，并在全局配置文件.openclaw-zero-state/openclaw.json中注册该提供商。

你需要为每一个你想使用的AI服务重复执行此步骤。例如，先配置deepseek-web，完成后再运行一次./onboard.sh webauth选择kimi-web。

脚本3：server.sh– 服务管理认证完成后，就可以启动网关服务了。

# 启动服务 ./server.sh # 或者使用更明确的命令 ./server.sh start

这个脚本会：

检查必要的构建产物和配置文件。
启动Node.js服务，默认监听3001端口。
同时启动Web UI服务。
在终端输出访问地址，通常是http://localhost:3001。

打开浏览器访问这个地址，你就能看到OpenClaw的Web聊天界面了。其他管理命令包括：

./server.sh stop：停止服务。
./server.sh restart：重启服务（在修改配置或代码后常用）。
./server.sh status：查看服务运行状态。

3.3 常见安装问题与排查

即使按照步骤操作，你也可能会遇到一些坑。这里我总结几个最常见的问题和解决方法。

问题1：启动服务时报错ERR_MODULE_NOT_FOUND或找不到dist/xxx-HASH.js这是最典型的问题，根本原因是构建产物的哈希值不匹配或缓存混乱。

解决方案：执行彻底的重建。

# 1. 停止当前服务 ./server.sh stop # 2. 删除所有构建产物和依赖 rm -rf dist dist-runtime node_modules .openclaw-zero-state/openclaw.json # 3. 重新安装和构建 pnpm install pnpm build pnpm ui:build # 4. 重新运行认证向导和服务 ./start-chrome-debug.sh # ... 在浏览器登录 ... ./onboard.sh webauth ./server.sh

问题2：onboard.sh向导卡住或报错“无法找到浏览器”这通常是因为调试浏览器没有正确启动，或者CDP连接地址不对。

解决方案：

确保start-chrome-debug.sh的终端窗口没有关闭。
检查是否有多个Chrome实例在运行，关掉无关的。
手动验证CDP连接。在浏览器地址栏输入chrome://version/，查看“命令行”一栏，确认有--remote-debugging-port=9222参数。
访问http://localhost:9222/json/version，应该能返回一个JSON信息。如果无法访问，说明调试端口没开。

问题3：Web UI能打开，但发送消息后无响应或报“Provider not configured”这说明网关服务虽然起来了，但没有成功加载你配置的AI提供商。

解决方案：

检查配置文件：cat .openclaw-zero-state/openclaw.json，确认models.providers部分有你添加的提供商（如deepseek-web）。
检查认证文件：ls -la .openclaw-zero-state/agents/main/agent/auth.json，确认文件存在且内容非空。
使用内置诊断命令：node dist/index.mjs doctor。这个命令会检查目录结构、文件权限和配置完整性，并给出修复建议。
如果诊断无效，最干脆的方法是回到上一步，用rm -rf .openclaw-zero-state清除状态，然后从onboard.sh开始重做。

4. 实战应用：多种方式调用与高级功能

成功部署并登录了一两个模型后，我们就可以开始真正使用它了。OpenClaw Zero Token提供了多种交互方式，适应不同场景。

4.1 Web UI 基础聊天与模型切换

启动./server.sh后，访问http://localhost:3001即可进入Web界面。它的界面简洁，类似于一个聚合版的ChatGPT。

核心操作：

发送消息：在底部的输入框直接输入问题。
切换模型：这是最关键的操作。在聊天输入框内，使用/model命令。
- 切换到Claude网页版：/model claude-web
- 切换到DeepSeek：/model deepseek-web
- 切换到豆包：/model doubao-web
- 你也可以指定具体模型：/model claude-web/claude-sonnet-4-6

经验之谈：对于Claude Web，强烈建议使用完整的模型ID，如/model claude-web/claude-sonnet-4-6。因为Claude的网页版可能有多个模型变体，只写claude-web有时会导致网关无法正确解析，从而回落到默认模型或报错。

查看可用模型：输入/models命令，会列出所有已在openclaw.json中配置好的提供商和模型，并显示当前激活的模型。

4.2 使用兼容OpenAI的HTTP API

对于开发者来说，HTTP API才是将能力集成到自己应用中的关键。OpenClaw网关提供了与OpenAI API格式高度兼容的端点，这意味着许多现有的OpenAI SDK或代码只需修改base_url和api_key即可无缝切换。

基础聊天补全接口：

curl http://127.0.0.1:3001/v1/chat/completions \ -H "Content-Type: application/json" \ -H "Authorization: Bearer your-gateway-token" \ -d '{ "model": "deepseek-web/deepseek-chat", "messages": [ {"role": "system", "content": "你是一个有帮助的助手。"}, {"role": "user", "content": "用Python写一个快速排序函数。"} ], "stream": true, # 支持流式输出 "temperature": 0.7 }'

参数解析：

model：格式为{provider-id}/{model-id}。你可以在/models命令的输出或openclaw.json中找到正确的ID。
Authorization头：这里的your-gateway-token是在openclaw.json的gateway.auth.token字段中配置的。如果未配置或配置为none，则可以省略此头。为了安全，建议在生产环境中设置一个强令牌。
stream：设置为true可以启用服务器推送事件，实现打字机效果。
其他参数如temperature,max_tokens等，如果后端网页API支持，也会被传递过去。

使用Python SDK调用：你可以直接使用openai库，只需重定向端点。

from openai import OpenAI # 指向本地OpenClaw网关 client = OpenAI( base_url="http://localhost:3001/v1", api_key="your-gateway-token" # 如果未设置网关令牌，这里可以填任意非空字符串 ) response = client.chat.completions.create( model="kimi-web/moonshot-v1-8k", # 使用Kimi模型 messages=[{"role": "user", "content": "你好，请介绍一下你自己。"}], stream=True ) for chunk in response: if chunk.choices[0].delta.content: print(chunk.choices[0].delta.content, end="")

4.3 杀手级功能：工具调用实战

这是OpenClaw Zero Token最令人兴奋的功能。它基于学术论文和ComfyUI LLM Party项目的思路，让网页版大模型具备了调用本地工具的能力。目前支持的工具包括：

web_search: 在互联网上搜索（需要额外配置搜索引擎API）。
web_fetch: 获取网页内容。
exec: 在服务器上执行Shell命令（需谨慎配置权限）。
read: 读取本地工作空间内的文件。
write: 向本地工作空间写入文件。
message: 发送消息（内部使用）。

工作原理：工具调用不是魔法。当你的用户消息中包含了触发关键词（如“搜索”、“查看文件”、“运行命令”），网关的中间件会在实际发送给AI的提示词前面，动态插入一段“系统指令”。这段指令定义了可用的工具列表、调用格式以及工作空间的路径限制。AI模型在理解了这段指令后，就会在其回复中按照特定格式（通常是JSON）输出工具调用请求。网关收到后，解析这个请求，在本地执行相应的工具，并将执行结果作为新的上下文再次发送给AI，由AI总结后回复给用户。

安全配置：由于exec和文件读写涉及系统安全，项目通过workspace（工作空间）目录进行严格隔离。你需要在配置文件中指定一个目录作为AI可以访问的沙箱。

编辑.openclaw-zero-state/openclaw.json，在agents.defaults部分添加：

{ "agents": { "defaults": { "workspace": "/path/to/your/safe/workspace" } } }

之后，所有通过read/write工具进行的文件操作，都会被限制在这个目录内。exec命令也会在这个目录下执行。

实战示例：让AI帮你分析日志假设你的工作空间/home/ai_workspace下有一个日志文件app.log。

在Web UI或API中，发送消息：“请帮我读取并分析一下工作空间里的app.log文件，看看有没有错误信息。”
AI（如DeepSeek）会识别出read工具的关键词，并在回复中返回一个工具调用请求。
网关执行read工具，读取/home/ai_workspace/app.log的内容。
网关将文件内容作为新的上下文发送给AI。
AI分析日志内容，并给出总结报告：“在app.log中发现了3条ERROR级别的日志，分别发生在...” 这个过程完全是自动的，你看到的就是AI直接给出了分析结果。

4.4 AskOnce：一次性横向评测所有模型

当你纠结于“哪个模型更适合回答这个问题”时，AskOnce功能就派上用场了。它可以让你的一次提问，同时发送给多个已配置的模型，并将它们的回答并排展示。

配置与使用：

配置多个提供商：确保你已通过onboard.sh配置了至少两个Web提供商（如DeepSeek和Kimi）。
启用AskOnce：在Web UI中，通常会在侧边栏或设置里找到AskOnce的开关或面板。
提问：在AskOnce的输入框中提问，例如“用五句话概括《三体》的核心思想”。
查看结果：稍等片刻，界面会以并列卡片的形式展示每个模型的回答。你可以直观地对比它们的回复速度、内容质量和风格差异。

这个功能对于模型评测、获取多样化的创意答案、或者单纯地想看看不同AI的“性格”都非常有用。

5. 深入配置与高级管理

当基本功能满足后，你可能需要根据自身需求进行更细致的配置和优化。

5.1 配置文件详解

项目的核心配置集中在.openclaw-zero-state/openclaw.json。理解其结构能帮你解决很多问题。

{ "auth": { "profiles": { "deepseek-web:default": { "provider": "deepseek-web", "mode": "api_key", // 对于web提供商，这里固定为api_key模式，但实际使用cookie "apiKey": "{{秘密占位符}}" // 实际凭证存储在独立的auth.json中 } } }, "models": { "providers": { "deepseek-web": { "baseUrl": "https://chat.deepseek.com", "api": "deepseek-web", // 对应后端的客户端实现 "models": [ { "id": "deepseek-chat", "name": "DeepSeek Chat", "contextWindow": 64000, "maxTokens": 4096, "capabilities": { "reasoning": false } }, { "id": "deepseek-reasoner", "name": "DeepSeek Reasoner", "contextWindow": 64000, "maxTokens": 8192, "capabilities": { "reasoning": true // 标识此模型支持“深度思考”模式 } } ] } } }, "gateway": { "port": 3001, // 网关监听端口 "auth": { "mode": "token", // 认证模式：none, token, bearer "token": "your-super-secret-token-here" // 建议修改为一个强密码 } }, "agents": { "defaults": { "workspace": "/tmp/openclaw_workspace" // 工具调用的安全沙箱目录 } } }

auth.profiles：这里列出的是认证配置的“入口”，真正的敏感凭证（cookies, tokens）存放在auth.json里，通过apiKey字段的占位符关联。
models.providers：定义了所有可用的模型。你可以在这里手动添加或修改模型参数，比如调整maxTokens。但新增一个提供商（如my-new-web）则需要开发对应的客户端模块。
gateway.auth：设置网关的安全性。对于本地开发，mode设为none最方便。如果服务需要暴露在局域网甚至公网（极度不推荐，除非你完全清楚风险），务必设置为token并设置一个复杂的令牌。

5.2 会话管理与凭证更新

网页登录的凭证会过期。当你发现某个模型突然无法调用，返回“未授权”或“会话失效”错误时，就需要更新凭证。

手动更新：

确保./start-chrome-debug.sh正在运行。
打开对应的浏览器标签页（如果已关闭，手动访问网站）。
网站通常会提示你重新登录或刷新会话。完成登录操作。
运行./onboard.sh webauth，选择对应的提供商（如deepseek-web）。向导会检测到已有浏览器会话，并尝试重新捕获最新的凭证。

自动化思路（进阶）：项目路线图中提到了自动刷新会话。目前你可以通过编写一个简单的定时任务（Cron Job）来半自动化这个过程。思路是：定期检查auth.json中某个凭证的过期时间（如果网站返回了该信息），或者定期用脚本重新打开浏览器并执行onboard.sh。但这需要一定的脚本编写能力，并且无法绕过需要人工交互的登录验证（如扫码）。

5.3 性能调优与稳定性建议

控制请求频率：模拟真人使用节奏，在代码中为请求添加随机延迟（例如1-5秒），避免短时间内爆发式请求。
使用连接池：如果你通过HTTP API高频调用，考虑在客户端使用连接池，避免频繁建立和断开TCP连接。
监控与日志：关注网关的日志输出（通常直接在运行./server.sh的终端查看），留意是否有大量的网络错误或429（请求过多）状态码。
备用方案：对于关键业务，不要100%依赖此免费方案。可以将其作为降级方案，与少量付费API配额结合使用。

6. 故障排查与经验实录

在实际使用中，我踩过不少坑。这里把最常见的问题和解决方法整理成表，希望能帮你快速排雷。

问题现象	可能原因	排查步骤与解决方案
启动`./server.sh`时报错，提示端口占用	3001端口已被其他程序使用，或之前的网关进程未完全退出。	1.`lsof -i :3001`查看占用进程的PID。 2.`kill -9 <PID>`结束该进程。 3. 或者修改`openclaw.json`中的`gateway.port`为其他端口，如`3002`。
Web UI页面空白或JS加载失败	前端资源`ui:build`未成功构建，或构建产物路径不对。	1. 确认执行过`pnpm ui:build`且无报错。 2. 检查`ui/dist`目录是否存在且内有文件。 3. 执行彻底的清理重建（见3.3节）。
调用API返回`404`或`Provider not found`	模型名称拼写错误，或该提供商未成功配置。	1. 使用`/models`命令确认可用的模型ID。 2. 检查`openclaw.json`中`models.providers`下是否有对应配置。 3. 重新运行`./onboard.sh webauth`为该提供商抓取凭证。
调用API返回`401 Unauthorized`	凭证已过期，或`auth.json`文件损坏、丢失。	1. 按5.2节的方法手动更新凭证。 2. 检查`.openclaw-zero-state/agents/main/agent/auth.json`文件是否存在且内容合法（是JSON格式）。 3. 可能是网关令牌错误，检查请求头中的`Authorization`是否与配置匹配。
模型回复速度极慢，或经常超时	目标网站服务器响应慢，或网络连接不稳定。也可能是触发了服务端的限流。	1. 手动访问该网站，确认其服务是否正常。 2. 在网关日志中查看是否有网络超时记录。 3. 降低请求频率，添加重试机制和更长的超时时间（可在客户端代码中设置）。
工具调用`exec`或文件读写失败	工作空间路径未配置或配置错误，或进程权限不足。	1. 确认`openclaw.json`中`agents.defaults.workspace`路径存在且网关进程有读写权限。 2. 对于`exec`，确保该目录在系统的安全路径内，且没有执行危险命令。 3. 查看网关日志，会有更详细的错误信息。
`onboard.sh`向导在“等待登录”环节无限等待	浏览器未正确登录，或CDP连接断开，或网站页面结构发生变化导致脚本无法检测登录状态。	1. 确认浏览器已成功登录，并停留在聊天主界面（而不是登录页）。 2. 重启`start-chrome-debug.sh`和`onboard.sh`。 3. 对于某些网站，可能需要等待更长时间，或手动在浏览器中触发一次聊天，让脚本捕获到API请求。

个人心得：

保持环境干净：这是我最大的教训。不要在不同项目间混用Node版本，也不要随意升级系统包。使用nvm和项目独立的.chrome-profile能避免很多诡异问题。
善用doctor命令：当遇到任何配置相关的问题时，第一时间运行node dist/index.mjs doctor。它给出的建议往往能直指问题核心。
凭证是核心：auth.json文件是命门。定期备份这个文件（当然要确保存储安全），当你迁移环境或重装系统时，可以直接恢复，省去重新登录所有网站的麻烦。
关注社区：这类项目迭代很快，网站前端的微小改动就可能导致客户端失效。多关注GitHub仓库的Issue和更新，及时拉取最新代码。

7. 扩展与二次开发指南

如果你不满足于现有功能，想添加新的AI网站支持或修改现有逻辑，这里有一些方向。

7.1 如何添加一个新的Web提供商

假设你想添加一个名为MyAI-Web的新服务。

研究目标网站：用浏览器开发者工具（F12），打开目标网站的聊天页面。在“网络”标签页中，找到真正的聊天API请求（通常是fetch或xhr类型）。记录下：请求URL、方法、Headers（特别是认证相关的Cookie和Authorization）、请求体格式、以及响应流格式（是SSE还是普通JSON）。
创建认证模块：在src/zero-token/providers/下创建myai-web-auth.ts。参考其他*-web-auth.ts文件，实现loginPlatformWeb函数。核心是使用Playwright打开登录页，等待用户手动登录，然后从网络请求中拦截凭证。
创建客户端模块：在相同目录下创建myai-web-client.ts。定义一个MyAIWebClient类，实现chatCompletions等方法。你需要根据步骤1的研究结果，构造正确的HTTP请求，并处理其独特的响应流。
创建流处理模块：在src/zero-token/streams/下创建myai-web-stream.ts。实现一个createMyAIWebStreamFn函数，将网站原生的流数据解析成项目内部统一的StreamChunk格式。
注册新模块：
- 在src/zero-token/streams/web-stream-factories.ts中，将你的流处理函数添加到webStreamFactories映射里。
- 在src/agents/web-stream-factories.ts中重新导出（这是为了保持向后兼容）。
- 在src/commands/auth-choice.apply.*.ts系列文件中，可能需要添加对新提供商的支持，以便onboard.sh能识别它。
测试：编写测试用例，然后运行pnpm build编译，最后通过onboard.sh和Web UI进行端到端测试。

7.2 与上游OpenClaw同步

OpenClaw Zero Token是原版OpenClaw的一个分支。如果你想获取原版在Agent框架、UI等方面的更新，可以同步上游代码。

# 添加上游仓库 git remote add upstream https://github.com/openclaw/openclaw.git # 获取上游更新 git fetch upstream # 合并到本地分支（可能会产生冲突，需要手动解决） git merge upstream/main

合并冲突是常态，尤其会发生在src/zero-token/目录外的文件。项目提供了docs/zero-token/upstream-sync.md文档，列出了需要特别注意的Zero Token特有文件，在合并时务必保留你的修改。

经过这一番从理论到实践，从部署到调试的深入探索，你应该已经能够驾驭OpenClaw Zero Token这个强大的工具了。它就像一把万能钥匙，为你打开了免费使用顶级AI模型的大门。记住，能力越大，责任越大。在享受技术便利的同时，请务必合理、合规地使用，尊重服务商的规则，并将它用于创造性的、积极的方向。

查看全文

http://www.jsqmd.com/news/738525/