当前位置：首页 > news >正文

OpenClaw入门教程：从零部署到第一个智能体

news 2026/7/14 21:07:40

OpenClaw

OpenClaw（原 Moltbot）是一个开源的 AI 智能体（Agent）框架，旨在通过连接大语言模型（LLM）与外部工具（如浏览器、API、办公软件），实现自动化任务执行。

与需要复杂编程的传统自动化方案不同，OpenClaw 允许用户通过自然语言指令来创建和调度智能体工作流。

本教程将通过一个“网页信息查询”的简单例子，详细讲解 OpenClaw 的核心概念、部署流程和基础配置。

一、核心概念与架构理解

在动手之前，理解 OpenClaw 的几个核心组件至关重要，这决定了你如何配置和使用它。

组件	角色与功能	类比说明
Gateway (网关)	核心服务，负责接收用户指令、调度智能体、调用工具并返回结果。它提供了一个 Web 管理界面（默认 `
127.0.0.1:18789`）用于配置和监控。	类似于智能家居的“总控中心”，所有指令都通过它来分发和执行。
Provider (模型提供商)	为大语言模型（LLM）提供推理服务的后端。OpenClaw 本身不包含模型，需要配置如 OpenAI API、Ollama（本地模型）、DeepSeek 等作为“大脑”。	相当于为智能体接上了一个“AI 大脑”，负责理解指令和规划行动。
Tool (工具)	智能体可以调用的具体能力模块，例如打开浏览器、读取网页、操作文件、调用 API 等。OpenClaw 内置了多种工具。	类似于智能体的“手和脚”，让 AI 能够与真实世界进行交互。
Agent (智能体)	由用户通过自然语言指令定义的、能够调用特定工具完成一项或一系列任务的自动化程序。	最终交付给用户的、可执行的“自动化员工”。

它们的工作流程可以概括为：用户指令 -> Gateway -> Provider (LLM理解与规划) -> 调用相应 Tool -> 执行并返回结果 -> Gateway -> 用户。

二、环境准备与基础部署

我们将以Windows 本地部署为例，这是最快捷的入门方式。

其他系统（如 Ubuntu）的步骤大同小异，主要区别在于包管理命令。

2.1 安装 Node.js 和 pnpm

OpenClaw 基于 Node.js 开发，因此需要先安装运行环境。

访问 Node.js 官网，下载并安装LTS 版本（推荐 v20.x 或 v22.x）。
安装完成后，打开命令行（CMD 或 PowerShell），验证安装：

node --version npm --version

安装pnpm（一个更快的 Node.js 包管理器）：

npm install -g pnpm

2.2 安装并启动 OpenClaw

使用pnpm全局安装 OpenClaw：

pnpm add -g @openwebui/openclaw

安装完成后，初始化并启动 OpenClaw 网关服务：

openclaw gateway

首次运行会进行初始化，成功后命令行会显示服务运行在http://127.0.0.1:18789。

3. 打开浏览器，访问http://127.0.0.1:18789，你将看到 OpenClaw 的 Web 管理界面。首次访问需要设置一个访问令牌（Token），请妥善保存，这是管理网关的凭证。

至此，OpenClaw 的框架已经运行起来，但它还没有“大脑”（LLM）和定义好的“任务”（Agent）。

三、配置“AI大脑”：连接大语言模型

OpenClaw 需要一个大语言模型来理解指令和规划行动。

这里我们以配置免费的Ollama 本地模型为例，因为它无需 API 密钥，最适合学习和测试。

3.1 安装并运行 Ollama

前往 Ollama 官网下载并安装。
安装后，在命令行拉取一个中等大小的模型，例如qwen2.5:7b：

ollama pull qwen2.5:7b

运行该模型以提供服务：

ollama run qwen2.5:7b

Ollama 默认会在http://127.0.0.1:11434提供一个兼容 OpenAI API 的接口。

3.2 在 OpenClaw 中添加模型提供商

在 OpenClaw Web 界面 (127.0.0.1:18789) 的侧边栏或设置中，找到“模型提供商”或“Providers”配置页面。
点击“添加提供商”，选择类型为“OpenAI 兼容”或“Ollama”。
在配置表单中填写：
- 名称：My-Ollama(自定义)
- 基础 URL：http://127.0.0.1:11434(Ollama 服务地址)
- 模型名称：qwen2.5:7b(你拉取的模型名)
- API 密钥：留空（Ollama 默认不需要）。
保存后，OpenClaw 就成功连接上了你的本地 LLM。

知识点延伸：Provider 类型
除了 Ollama，你还可以配置：

OpenAI / Azure OpenAI：填写官方 API Key 和 Endpoint。
DeepSeek / 智谱AI等国内厂商：通常也提供 OpenAI 兼容接口，只需修改 Base URL 和 API Key。
本地部署的其他模型服务（如 LM Studio, vLLM）：只要其 API 与 OpenAI 格式兼容，均可类似配置。

四、创建第一个智能体：网页信息查询助手

现在我们来创建一个实用的智能体：“网页摘要助手”。

它的任务是：根据用户提供的网址，自动打开浏览器访问该页面，抓取主要内容，并生成一份简洁的摘要。

4.1 理解智能体的构成

创建一个智能体，本质上是为 LLM 编写一份“工作说明书”（Prompt），并赋予它调用工具的权限。

在 OpenClaw 中，这通常通过一个结构化的配置文件（如agent.yaml）或 Web 界面表单来完成。

4.2 通过 Web 界面创建智能体

在 OpenClaw Web 界面的“智能体”或“Agents”页面，点击“创建新智能体”。
基础信息：
- 名称：网页摘要助手
- 描述：访问指定网址，并总结网页核心内容。
- 模型：选择我们刚才配置的My-Ollama (qwen2.5:7b)。

系统指令（核心）：
在“系统提示词”或“指令”框中，输入以下内容。这部分是指导 AI 如何行动的关键：

你是一个网页内容分析助手。你的任务是： 1. 当用户给你一个网址（URL）时，使用`browser_open`工具打开该网页。 2. 等待页面加载完成后，使用`browser_extract`工具提取网页中的主要文本内容。 3. 基于提取的内容，生成一段简洁、准确的摘要，突出页面的主题、关键信息和结论。 4. 将摘要以友好的语气回复给用户。 注意事项： - 确保网址是有效的HTTP或HTTPS链接。 - 摘要应控制在200字以内，语言流畅。 - 如果无法访问网页或提取内容失败，请如实告知用户。

知识点：系统指令需要清晰、无歧义，并明确指定在何种情况下使用哪个工具。工具名（如browser_open）必须与 OpenClaw 内置的工具名称完全一致。

工具授权：
在工具选择部分，勾选此智能体需要使用的工具：
- browser_open：打开浏览器并导航到指定 URL。
- browser_extract：从当前打开的页面中提取文本内容。
  （OpenClaw 可能还有其他浏览器相关工具，如browser_screenshot，本例暂不需要）。
保存：点击保存，你的第一个智能体就创建完成了。

4.3 测试智能体

在智能体列表中找到刚创建的“网页摘要助手”，点击“运行”或“对话”。
在聊天输入框中，发送一个网址，例如：https://news.baidu.com/
观察执行过程：
- Gateway 会将你的指令和系统提示词一起发送给配置的 LLM (qwen2.5:7b)。
- LLM 会“思考”并决定第一步应该调用browser_open工具，并附上 URL 参数。
- Gateway 接收到这个工具调用请求后，会命令浏览器工具执行打开网页的操作。
- 浏览器工具执行成功后，将结果（如“页面加载成功”）返回给 Gateway。
- Gateway 将结果再次反馈给 LLM。
- LLM 根据“页面已打开”的结果，决定下一步调用browser_extract工具来抓取文本。
- 如此循环，直到 LLM 认为任务完成，生成最终摘要并返回给用户。
你将在界面中看到最终的文本摘要。

五、核心知识点详解与故障排查

5.1 工具调用机制

这是 OpenClaw 最核心的机制。LLM 并不直接操作浏览器，而是通过JSON-RPC格式的请求来调用工具。

一个典型的工具调用请求如下：

{ "tool": "browser_open", "args": { "url": "https://example.com" } }

Gateway 收到后，会找到注册的browser_open工具执行函数，执行完毕后再将结果封装返回给 LLM。这个过程对用户是透明的，但理解它有助于调试。

5.2 上下文（Context）管理

LLM 有上下文窗口限制（例如 4K, 8K, 32K tokens）。OpenClaw 与 LLM 的多轮对话（包括用户指令、系统提示、工具调用及结果）都会消耗上下文。

问题：如果任务步骤很多，或网页内容很长，可能超出上下文限制，导致 LLM 失忆或报错。
解决方案：
1. 在 Ollama 拉取模型时，选择支持更长上下文的版本（如qwen2.5:32b）或使用-c参数调整上下文大小。
2. 在系统指令中要求 LLM 进行总结性回复，避免返回过长的原始文本。

5.3 常见部署问题排查

问题现象	可能原因	解决方案
`openclaw`命令未找到	Node.js 或 pnpm 未正确安装，或全局模块路径未加入系统 PATH。	检查 Node.js/pnpm 安装，重启终端，或手动将`npm global`路径加入系统环境变量。
网关页面无法访问 (`
127.0.0.1:18789`)	网关服务未成功启动；端口被占用；防火墙阻止。	检查命令行中网关服务是否运行正常；尝试更换端口；检查防火墙设置。
模型提供商连接失败	Ollama 服务未启动；Base URL 或模型名错误；网络问题。	运行`ollama serve`确保服务运行；在浏览器访问`http://127.0.0.1:11434`测试 Ollama；检查配置。
智能体执行时报“工具未授权”或“工具不存在”	创建智能体时未勾选对应工具；工具名称拼写错误。	返回智能体编辑页面，确认并勾选所需工具；检查系统指令中的工具名是否与列表中的完全一致。
浏览器工具执行失败	系统未安装 Chrome/Chromium 浏览器；浏览器驱动问题。	确保已安装 Chrome；OpenClaw 的浏览器工具通常依赖内置的 Chrome Relay，检查相关配置。

5.4 扩展：接入飞书/钉钉机器人

OpenClaw 的一大特色是易于与企业办公平台集成。

在飞书开放平台创建应用，获取App ID和App Secret。
启用机器人能力，并获取Encrypt Key和Verification Token。
在 OpenClaw Gateway Web 界面的“集成”或“Channels”部分，选择飞书，填写上述信息，并配置 Webhook URL（需公网可访问，本地开发可使用内网穿透工具如ngrok）。
配置事件订阅，尤其是“接收消息”权限。
将智能体分配给该飞书通道。完成后，你就可以在飞书群里 @ 机器人并发送指令（如“总结一下 https://example.com 的内容”），机器人会调用“网页摘要助手”来回复你。

通过这个从环境搭建、模型配置到创建并测试第一个智能体的完整流程，你应该对 OpenClaw 的工作原理和基本操作有了扎实的理解。

接下来，你可以尝试创建更复杂的智能体，例如结合文件操作工具进行文档总结，或接入天气 API 制作一个查询助手，不断探索 AI 智能体自动化的可能性。