OpenClaw入门教程:从零部署到第一个智能体
OpenClaw
OpenClaw(原 Moltbot)是一个开源的 AI 智能体(Agent)框架,旨在通过连接大语言模型(LLM)与外部工具(如浏览器、API、办公软件),实现自动化任务执行。
与需要复杂编程的传统自动化方案不同,OpenClaw 允许用户通过自然语言指令来创建和调度智能体工作流。
本教程将通过一个“网页信息查询”的简单例子,详细讲解 OpenClaw 的核心概念、部署流程和基础配置。
一、核心概念与架构理解
在动手之前,理解 OpenClaw 的几个核心组件至关重要,这决定了你如何配置和使用它。
| 组件 | 角色与功能 | 类比说明 |
|---|---|---|
| Gateway (网关) | 核心服务,负责接收用户指令、调度智能体、调用工具并返回结果。它提供了一个 Web 管理界面(默认 ` | |
| 127.0.0.1:18789`)用于配置和监控。 | 类似于智能家居的“总控中心”,所有指令都通过它来分发和执行。 | |
| Provider (模型提供商) | 为大语言模型(LLM)提供推理服务的后端。OpenClaw 本身不包含模型,需要配置如 OpenAI API、Ollama(本地模型)、DeepSeek 等作为“大脑”。 | 相当于为智能体接上了一个“AI 大脑”,负责理解指令和规划行动。 |
| Tool (工具) | 智能体可以调用的具体能力模块,例如打开浏览器、读取网页、操作文件、调用 API 等。OpenClaw 内置了多种工具。 | 类似于智能体的“手和脚”,让 AI 能够与真实世界进行交互。 |
| Agent (智能体) | 由用户通过自然语言指令定义的、能够调用特定工具完成一项或一系列任务的自动化程序。 | 最终交付给用户的、可执行的“自动化员工”。 |
它们的工作流程可以概括为:用户指令 -> Gateway -> Provider (LLM理解与规划) -> 调用相应 Tool -> 执行并返回结果 -> Gateway -> 用户。
二、环境准备与基础部署
我们将以Windows 本地部署为例,这是最快捷的入门方式。
其他系统(如 Ubuntu)的步骤大同小异,主要区别在于包管理命令。
2.1 安装 Node.js 和 pnpm
OpenClaw 基于 Node.js 开发,因此需要先安装运行环境。
- 访问 Node.js 官网,下载并安装LTS 版本(推荐 v20.x 或 v22.x)。
- 安装完成后,打开命令行(CMD 或 PowerShell),验证安装:
node --version npm --version- 安装
pnpm(一个更快的 Node.js 包管理器):
npm install -g pnpm2.2 安装并启动 OpenClaw
- 使用
pnpm全局安装 OpenClaw:
pnpm add -g @openwebui/openclaw- 安装完成后,初始化并启动 OpenClaw 网关服务:
openclaw gateway首次运行会进行初始化,成功后命令行会显示服务运行在http://127.0.0.1:18789。
3. 打开浏览器,访问http://127.0.0.1:18789,你将看到 OpenClaw 的 Web 管理界面。首次访问需要设置一个访问令牌(Token),请妥善保存,这是管理网关的凭证。
至此,OpenClaw 的框架已经运行起来,但它还没有“大脑”(LLM)和定义好的“任务”(Agent)。
三、配置“AI大脑”:连接大语言模型
OpenClaw 需要一个大语言模型来理解指令和规划行动。
这里我们以配置免费的Ollama 本地模型为例,因为它无需 API 密钥,最适合学习和测试。
3.1 安装并运行 Ollama
- 前往 Ollama 官网 下载并安装。
- 安装后,在命令行拉取一个中等大小的模型,例如
qwen2.5:7b:
ollama pull qwen2.5:7b- 运行该模型以提供服务:
ollama run qwen2.5:7bOllama 默认会在http://127.0.0.1:11434提供一个兼容 OpenAI API 的接口。
3.2 在 OpenClaw 中添加模型提供商
- 在 OpenClaw Web 界面 (
127.0.0.1:18789) 的侧边栏或设置中,找到“模型提供商”或“Providers”配置页面。 - 点击“添加提供商”,选择类型为“OpenAI 兼容”或“Ollama”。
- 在配置表单中填写:
- 名称:
My-Ollama(自定义) - 基础 URL:
http://127.0.0.1:11434(Ollama 服务地址) - 模型名称:
qwen2.5:7b(你拉取的模型名) - API 密钥:留空(Ollama 默认不需要)。
- 名称:
- 保存后,OpenClaw 就成功连接上了你的本地 LLM。
知识点延伸:Provider 类型
除了 Ollama,你还可以配置:
- OpenAI / Azure OpenAI:填写官方 API Key 和 Endpoint。
- DeepSeek / 智谱AI等国内厂商:通常也提供 OpenAI 兼容接口,只需修改 Base URL 和 API Key。
- 本地部署的其他模型服务(如 LM Studio, vLLM):只要其 API 与 OpenAI 格式兼容,均可类似配置。
四、创建第一个智能体:网页信息查询助手
现在我们来创建一个实用的智能体:“网页摘要助手”。
它的任务是:根据用户提供的网址,自动打开浏览器访问该页面,抓取主要内容,并生成一份简洁的摘要。
4.1 理解智能体的构成
创建一个智能体,本质上是为 LLM 编写一份“工作说明书”(Prompt),并赋予它调用工具的权限。
在 OpenClaw 中,这通常通过一个结构化的配置文件(如agent.yaml)或 Web 界面表单来完成。
4.2 通过 Web 界面创建智能体
- 在 OpenClaw Web 界面的“智能体”或“Agents”页面,点击“创建新智能体”。
- 基础信息:
- 名称:
网页摘要助手 - 描述:
访问指定网址,并总结网页核心内容。 - 模型:选择我们刚才配置的
My-Ollama (qwen2.5:7b)。
- 名称:
- 系统指令(核心):
在“系统提示词”或“指令”框中,输入以下内容。这部分是指导 AI 如何行动的关键:
知识点:系统指令需要清晰、无歧义,并明确指定在何种情况下使用哪个工具。工具名(如你是一个网页内容分析助手。你的任务是: 1. 当用户给你一个网址(URL)时,使用`browser_open`工具打开该网页。 2. 等待页面加载完成后,使用`browser_extract`工具提取网页中的主要文本内容。 3. 基于提取的内容,生成一段简洁、准确的摘要,突出页面的主题、关键信息和结论。 4. 将摘要以友好的语气回复给用户。 注意事项: - 确保网址是有效的HTTP或HTTPS链接。 - 摘要应控制在200字以内,语言流畅。 - 如果无法访问网页或提取内容失败,请如实告知用户。browser_open)必须与 OpenClaw 内置的工具名称完全一致。 - 工具授权:
在工具选择部分,勾选此智能体需要使用的工具:browser_open:打开浏览器并导航到指定 URL。browser_extract:从当前打开的页面中提取文本内容。
(OpenClaw 可能还有其他浏览器相关工具,如browser_screenshot,本例暂不需要)。
- 保存:点击保存,你的第一个智能体就创建完成了。
4.3 测试智能体
- 在智能体列表中找到刚创建的“网页摘要助手”,点击“运行”或“对话”。
- 在聊天输入框中,发送一个网址,例如:
https://news.baidu.com/ - 观察执行过程:
- Gateway 会将你的指令和系统提示词一起发送给配置的 LLM (
qwen2.5:7b)。 - LLM 会“思考”并决定第一步应该调用
browser_open工具,并附上 URL 参数。 - Gateway 接收到这个工具调用请求后,会命令浏览器工具执行打开网页的操作。
- 浏览器工具执行成功后,将结果(如“页面加载成功”)返回给 Gateway。
- Gateway 将结果再次反馈给 LLM。
- LLM 根据“页面已打开”的结果,决定下一步调用
browser_extract工具来抓取文本。 - 如此循环,直到 LLM 认为任务完成,生成最终摘要并返回给用户。
- Gateway 会将你的指令和系统提示词一起发送给配置的 LLM (
- 你将在界面中看到最终的文本摘要。
五、核心知识点详解与故障排查
5.1 工具调用机制
这是 OpenClaw 最核心的机制。LLM 并不直接操作浏览器,而是通过JSON-RPC格式的请求来调用工具。
一个典型的工具调用请求如下:
{ "tool": "browser_open", "args": { "url": "https://example.com" } }Gateway 收到后,会找到注册的browser_open工具执行函数,执行完毕后再将结果封装返回给 LLM。这个过程对用户是透明的,但理解它有助于调试。
5.2 上下文(Context)管理
LLM 有上下文窗口限制(例如 4K, 8K, 32K tokens)。OpenClaw 与 LLM 的多轮对话(包括用户指令、系统提示、工具调用及结果)都会消耗上下文。
- 问题:如果任务步骤很多,或网页内容很长,可能超出上下文限制,导致 LLM 失忆或报错。
- 解决方案:
- 在 Ollama 拉取模型时,选择支持更长上下文的版本(如
qwen2.5:32b)或使用-c参数调整上下文大小。 - 在系统指令中要求 LLM 进行总结性回复,避免返回过长的原始文本。
- 在 Ollama 拉取模型时,选择支持更长上下文的版本(如
5.3 常见部署问题排查
| 问题现象 | 可能原因 | 解决方案 |
|---|---|---|
openclaw命令未找到 | Node.js 或 pnpm 未正确安装,或全局模块路径未加入系统 PATH。 | 检查 Node.js/pnpm 安装,重启终端,或手动将npm global路径加入系统环境变量。 |
| 网关页面无法访问 (` | ||
| 127.0.0.1:18789`) | 网关服务未成功启动;端口被占用;防火墙阻止。 | 检查命令行中网关服务是否运行正常;尝试更换端口;检查防火墙设置。 |
| 模型提供商连接失败 | Ollama 服务未启动;Base URL 或模型名错误;网络问题。 | 运行ollama serve确保服务运行;在浏览器访问http://127.0.0.1:11434测试 Ollama;检查配置。 |
| 智能体执行时报“工具未授权”或“工具不存在” | 创建智能体时未勾选对应工具;工具名称拼写错误。 | 返回智能体编辑页面,确认并勾选所需工具;检查系统指令中的工具名是否与列表中的完全一致。 |
| 浏览器工具执行失败 | 系统未安装 Chrome/Chromium 浏览器;浏览器驱动问题。 | 确保已安装 Chrome;OpenClaw 的浏览器工具通常依赖内置的 Chrome Relay,检查相关配置。 |
5.4 扩展:接入飞书/钉钉机器人
OpenClaw 的一大特色是易于与企业办公平台集成。
- 在飞书开放平台创建应用,获取
App ID和App Secret。 - 启用机器人能力,并获取
Encrypt Key和Verification Token。 - 在 OpenClaw Gateway Web 界面的“集成”或“Channels”部分,选择飞书,填写上述信息,并配置 Webhook URL(需公网可访问,本地开发可使用内网穿透工具如
ngrok)。 - 配置事件订阅,尤其是“接收消息”权限。
- 将智能体分配给该飞书通道。完成后,你就可以在飞书群里 @ 机器人并发送指令(如“总结一下 https://example.com 的内容”),机器人会调用“网页摘要助手”来回复你。
通过这个从环境搭建、模型配置到创建并测试第一个智能体的完整流程,你应该对 OpenClaw 的工作原理和基本操作有了扎实的理解。
接下来,你可以尝试创建更复杂的智能体,例如结合文件操作工具进行文档总结,或接入天气 API 制作一个查询助手,不断探索 AI 智能体自动化的可能性。
参考来源
- 最新中文版OpenClaw详细安装教程 包含云模型和本地模型部署方法
- 在 Ubuntu 上快速部署 OpenClaw 完整教程
- 什么是OpenClaw?OpenClaw能做什么?2026年OpenClaw详细介绍及部署教程
- OpenClaw本地部署教程
- OpenClaw详细安装教程
- 在windows上安装openclaw详细教程
