当前位置：首页 > news >正文

WhatsApp控制本地电脑：OpenClaw消息驱动自动化实战

news 2026/7/17 12:44:12

1. 项目概述：这不是“远程控制”，而是“消息驱动的本地自动化”

你有没有过这样的时刻：人在地铁上，突然想起电脑上有个文件要发给同事，但又不想打开笔记本、连VPN、折腾远程桌面；或者在厨房煮着汤，手机弹出一条WhatsApp消息说“老板刚发了新需求文档”，而你的主力开发机正安静地待在书房里——这时候，如果能直接在WhatsApp里敲一句“把D:\projects\q3-report.xlsx发到邮箱”，电脑就自动执行，是不是比切回微信小程序、再点开远程控制App快得多？OpenClaw（也叫Clawdbot）干的就是这件事：它不走传统远程桌面或SSH那套路子，而是把WhatsApp变成一个轻量级、免安装、带身份验证的命令通道。核心逻辑非常朴素——你发一条特定格式的消息，比如/run notepad，运行在你本地PC上的OpenClaw服务收到后，解析指令、校验发送者是否在白名单里、执行对应操作，再把结果（成功/失败/截图）原路发回WhatsApp。它不暴露IP，不穿透防火墙，不依赖公网服务器中转指令，所有敏感动作都在你自己的机器上完成。关键词里那个“Clawdbot”不是随便起的代号，它直指本质：这是一个以WhatsApp为前端界面的、可编程的本地机器人（bot）。它解决的不是“我怎么看到另一台电脑的屏幕”，而是“我怎么用最顺手的聊天工具，触发我这台电脑上早已写好的自动化脚本”。适合谁？是那些每天要在多个设备间切换、厌倦了重复性操作的程序员、运营、设计师、甚至家庭用户——比如让爸妈在WhatsApp里发个/print receipt.pdf，家里的Windows电脑就自动调用打印机；或者让团队成员发/backup photos，NAS就立刻开始同步手机相册。它不替代TeamViewer，但能让你绕过80%的“小任务”远程操作场景。我第一次试的时候，只用了17分钟就让我的MacBook响应了第一条/screenshot指令，整个过程没装任何第三方远程软件，也没动路由器设置。这种“无感集成”的体验，恰恰是它最被低估的价值。

2. 核心设计思路与方案选型逻辑

2.1 为什么放弃传统远程方案，选择WhatsApp作为控制信道？

很多人第一反应是：“WhatsApp不是加密聊天App吗？怎么能当控制台用？”这恰恰是OpenClaw最精妙的设计起点。我们来拆解三个主流方案的硬伤：

远程桌面类（如AnyDesk、Chrome Remote Desktop）：需要目标机器常驻后台服务、开放端口、处理NAT穿透，对非技术用户极不友好。更关键的是，它把整台电脑的控制权交出去了——哪怕只是临时授权，心理门槛也很高。我帮亲戚调试时，他们盯着屏幕上跳出来的“正在共享您的桌面”提示，手都在抖。
SSH + 命令行：技术人最爱，但前提是目标机必须跑Linux/macOS、配置好密钥、防火墙放行22端口。Windows用户得额外装OpenSSH Server，还得教他们怎么生成密钥对。有一次我给销售同事配了一台Windows测试机，光是解释“为什么你连不上SSH”就花了45分钟，最后发现是他公司网络策略直接封死了所有非80/443端口。
自建Web API + 手机浏览器访问：看似优雅，实则暗坑无数。你需要一台公网可访问的服务器（成本）、HTTPS证书（维护）、登录鉴权（安全风险），还要确保手机浏览器能稳定加载页面。去年我用Flask搭了个简易API，结果发现公司WiFi会拦截自签名证书，客户在会议室根本打不开控制页。

OpenClaw反其道而行之：它利用WhatsApp已有的、被全球数十亿人验证过的基础设施——消息推送、端到端加密、联系人关系链、离线消息队列。你不需要申请域名、不用配SSL、不用开防火墙，只要手机能收发WhatsApp消息，就能控制电脑。它的“服务器”就是你自己的PC，而WhatsApp只是个信使。这种设计规避了所有网络层的复杂性，把问题域彻底收敛到应用层：如何让本地程序可靠地收发WhatsApp消息？答案是——不自己造轮子，而是复用WhatsApp官方Web客户端的底层协议。OpenClaw本质上是一个“无头浏览器自动化代理”，它启动一个隐藏的Chrome实例，自动登录你的WhatsApp Web，然后监听消息事件。这听起来像黑科技，但实际非常稳健：WhatsApp Web本身就有完善的WebSocket长连接和消息ACK机制，丢消息的概率比你自己写的HTTP轮询低两个数量级。我实测连续72小时运行，只出现过1次因WhatsApp Web强制刷新导致的短暂断连，30秒内自动重连成功。这种“站在巨人肩膀上”的取舍，是它能在零运维前提下保持高可用的核心原因。

2.2 OpenClaw与Clawdbot命名的深层含义：一个架构，两种角色

项目标题里同时出现“OpenClaw”和“Clawdbot”，初看容易混淆。其实这是同一套代码的两种运行模式，对应完全不同的职责分工：

OpenClaw是底层引擎，一个Python编写的、可扩展的自动化框架。它提供核心能力：WhatsApp消息监听与解析、命令路由分发、执行环境沙箱、结果回传。你可以把它理解成一个“操作系统内核”——它不关心具体要执行什么命令，只负责安全、可靠、有序地把指令交给对应的“应用程序”。
Clawdbot则是预置的、开箱即用的“系统应用”。它内置了一组常用命令集：/screenshot（截屏）、/run <program>（启动程序）、/shell <command>（执行Shell命令）、/file <path>（发送文件）、/list（查看支持命令）。这些命令就像Windows里的“记事本”、“计算器”一样，是用户最可能第一时间用到的功能。Clawdbot的存在，让新手5分钟就能上手，而OpenClaw的模块化设计，则允许老手轻松添加自定义命令——比如写一个/weather命令，调用天气API后把结果发回；或者/git-pull，自动拉取指定仓库最新代码。

这种分层设计解决了“易用性”和“可扩展性”的经典矛盾。很多同类工具要么功能简陋（只能开关机），要么配置复杂（要写YAML规则、配Redis队列）。OpenClaw用Python的装饰器语法实现了命令注册，新增一个功能只需三行代码：

@clawbot.command("translate", help="翻译文本: /translate hello world") def translate_command(ctx): text = ctx.args result = google_translate(text, target_lang="zh") ctx.reply(f"翻译结果: {result}")

这段代码会被OpenClaw自动识别、注入命令列表、加入帮助文档。我去年给一个跨境电商团队定制了/order-status <order-id>命令，从ERP系统查单状态并格式化返回，从开发到上线只用了2小时。这种“写完即用”的敏捷性，正是Clawdbot作为“应用层”的价值所在。

2.3 安全模型：为什么它敢让你用WhatsApp控制生产机？

安全性是这类工具的生命线。OpenClaw没有采用“密码登录”这种原始方式，而是构建了一个三层防御体系：

通信层加密：所有消息都走WhatsApp官方端到端加密通道。OpenClaw本身不接触明文消息内容，它只接收WhatsApp Web SDK推送的、已解密的消息对象。这意味着即使有人劫持了你的本地网络流量，也看不到任何指令细节——因为加密发生在WhatsApp服务器端，解密发生在你的浏览器内存里。
身份认证层：默认只响应来自“已保存联系人”的消息。它读取你WhatsApp通讯录里的联系人列表（通过WhatsApp Web的Contacts API），将发信人的手机号哈希值与白名单比对。你可以在配置文件里手动添加信任号码，比如+8613800138000，但绝不会响应陌生号码的/shutdown指令。更进一步，它支持“PIN码二次验证”：首次执行高危命令（如/shell）时，会要求对方在消息里附带一个动态PIN，这个PIN由OpenClaw生成并显示在你的PC终端上，有效期仅2分钟。我测试过，同事误发/shell rm -rf /时，因为没带PIN，系统直接返回“未授权操作，请输入当前PIN”。
执行沙箱层：所有命令都在受限环境中运行。/shell命令默认禁用危险参数（如&&、|、$()），/run只允许启动白名单内的程序（Notepad、Chrome、VSCode等），/file发送前会检查文件路径是否在预设的安全目录内（如C:\Users\YourName\Documents）。最狠的一招是进程监控：当你执行/screenshot时，OpenClaw会启动一个独立的、无窗口的Python进程专门截图，该进程结束后立即销毁，不会留下任何后台服务。这种“用完即焚”的设计，极大降低了持久化攻击的风险。

这套组合拳下来，它的安全强度远超很多打着“企业级”旗号的远程工具。毕竟，WhatsApp Web本身已是经过Facebook安全团队十年打磨的成熟产品，OpenClaw只是借力打力，把安全责任交还给了更专业的团队。

3. 核心细节解析与实操要点

3.1 环境准备：为什么必须用Python 3.9+和Chrome 115+？

OpenClaw对运行环境有明确要求，这不是开发者偷懒，而是底层依赖决定的硬性约束。我们来逐条拆解：

Python 3.9+：核心依赖库whatsapp-web.js（一个Node.js库的Python绑定）在3.9版本才正式支持asyncio的TaskGroup特性。这个特性让OpenClaw能并发处理多条消息而不阻塞主线程。我试过降级到3.8，结果在同时收到/screenshot和/run chrome两条指令时，第二个指令会卡住长达8秒——因为旧版asyncio的事件循环无法高效调度。3.9的TaskGroup像一个智能交通指挥中心，确保每个命令都在独立“车道”上执行，互不干扰。
Chrome 115+：这是最关键的一环。WhatsApp Web在2023年Q3强制升级了前端框架，弃用了旧版Puppeteer兼容的WebDriver协议，转而依赖Chrome DevTools Protocol (CDP) 的新特性。低于115的Chrome版本，其CDP接口缺少Emulation.setGeolocationOverride等关键方法，导致OpenClaw无法正确模拟手机UA（User-Agent），进而被WhatsApp Web识别为“不支持的浏览器”而拒绝登录。我用Chrome 114反复调试了3小时，日志里全是Error: Failed to launch the browser process!，直到升级到115.0.5790.170，一行代码没改，登录瞬间成功。这个细节很多教程都忽略，但它是成败的关键。
为什么不用Edge或Firefox？
OpenClaw的底层驱动是playwright，它对Chrome/Chromium的支持最完善。Edge虽然基于Chromium，但其CDP实现有细微差异，曾导致消息监听丢失；Firefox则完全不支持WhatsApp Web所需的WebAssembly加速模块。实测数据：Chrome 115+的成功率是99.2%，Edge 115是87.3%，Firefox 115直接无法登录。所以，别试图“省事”，老老实实下载Chrome Stable Channel的最新版。

提示：安装Chrome后，务必在地址栏输入chrome://version/确认版本号。如果显示的是115.0.xxxx，再继续；如果还是114.x，请手动去 Google Chrome官网下载离线安装包，避免Windows Update自动降级。

3.2 配置文件详解：`config.yaml`里的每一个字段都是经验之谈

OpenClaw的配置文件config.yaml看起来只有十几行，但每个字段背后都有血泪教训。我们逐项解读，并给出生产环境推荐值：

# config.yaml whatsapp: # 这是你的WhatsApp账号，必须是完整国际格式，+86开头 phone: "+8613800138000" # 登录超时时间（秒）。太短会因网络波动失败，太长会卡住整个流程 timeout: 60 # 是否启用QR码登录（推荐新手）。设为false则用手机号+验证码登录 use_qr: true security: # 白名单号码列表。强烈建议只加1-2个最信任的号码 # 格式必须是+国家码+号码，不能有空格或横杠 allowed_phones: - "+8613800138000" - "+8613900139000" # PIN码长度。4位太简单，8位难记，6位是最佳平衡点 pin_length: 6 # 高危命令的PIN有效期（秒）。2分钟足够操作，又防暴力破解 pin_ttl: 120 commands: # 截图保存路径。必须是绝对路径，且目录需存在 screenshot_path: "C:\\Users\\YourName\\Pictures\\clawdbot" # 文件发送的根目录限制。所有`/file`命令只能发送此目录下的文件 file_root: "C:\\Users\\YourName\\Documents" # Shell命令白名单。禁止执行`rm`、`format`等危险命令 shell_whitelist: - "dir" - "ls" - "ping" - "curl" - "python"

几个关键经验点：

phone字段的格式陷阱：很多人填13800138000或008613800138000，结果OpenClaw报错Invalid phone number。WhatsApp官方API只认+8613800138000这种格式，+号必须存在，且不能有空格。我见过最惨的案例：一位用户填了+86 138 0013 8000（带空格），OpenClaw静默失败，日志里没有任何错误提示，他以为是程序bug，折腾了一整天。
use_qr: true的实操技巧：QR码登录时，OpenClaw会自动打开Chrome并显示二维码。但如果你的显示器缩放比例是125%或150%（Windows常见设置），Chrome窗口里的二维码会模糊不清，扫码失败。解决方案：在Chrome启动前，先执行chrome.exe --force-device-scale-factor=1。这个参数可以强制Chrome忽略系统缩放，保证二维码清晰。我已经把这个命令写进了OpenClaw的启动脚本里，新手无需操心。
file_root的安全边界：这个字段不是可选项，而是强制安全栅栏。假设你设为C:\，那么有人发/file C:\Windows\System32\drivers\etc\hosts，就能把你的系统hosts文件发出去。OpenClaw会严格校验：/file Documents/report.pdf→ 允许；/file ..\..\Windows\win.ini→ 拒绝，并返回“路径越界”。我建议永远设为C:\Users\YourName\Documents，这是最安全的“用户数据区”。

注意：配置文件必须用UTF-8编码保存，否则中文注释会导致Python解析失败。用Notepad++打开，点击“编码”→“转为UTF-8无BOM格式”，再保存。

3.3 命令语法与权限分级：哪些能直接执行，哪些要过PIN？

OpenClaw的命令不是平铺直叙的，而是按风险等级分了三级，每级对应不同的执行策略。理解这个分层，是安全使用的基础：

命令类型	示例	执行条件	典型场景	我的实操心得
L1：无条件执行	`/help`,`/list`,`/screenshot`	无需PIN，白名单内即可	快速获取帮助、截屏反馈、查看当前状态	`/screenshot`是我用得最多的命令。它默认截取主屏，但如果有多显示器，会合并成一张大图。我发现一个隐藏技巧：在命令后加参数`/screenshot monitor=2`，就能只截第二块屏。这个参数文档没写，是我翻源码`commands/screenshot.py`发现的。
L2：PIN验证执行	`/shell dir C:\`,`/run notepad`	首次执行需输入PIN，后续2小时内免验	执行Shell命令、启动程序	`shell`命令默认禁用管道符，但如果你真需要`dir C:\ \| findstr "txt"`，可以在配置里加`shell_whitelist: ["dir", "findstr"]`，然后用`/shell dir C:\`和`/shell findstr "txt"`分两步走。比强行开权限安全得多。
L3：禁止执行	`/shell format C:`,`/run cmd`	系统硬性拦截，不记录日志	防止误操作或恶意指令	曾有同事开玩笑发`/shell shutdown -s -t 0`，OpenClaw直接返回“该命令已被系统禁用”。后来我给他开了个玩笑：在`shell_whitelist`里加了`shutdown`，但他忘了加`-s`参数，结果执行`/shell shutdown`后，电脑弹出“关机倒计时1分钟”的对话框……从此他再也不敢乱试高危命令了。

这个分级不是拍脑袋定的，而是基于OWASP Top 10安全风险评估。L1命令只读取本地信息或生成新文件（截图），无副作用；L2命令可能修改系统状态（启动程序、执行命令），需二次确认；L3则是公认的“核按钮”，一律物理隔离。你在配置里看到的pin_ttl: 120，就是为L2命令设计的“宽限期”——既不让用户每次操作都输PIN（体验差），也不让PIN长期有效（风险高）。

4. 实操过程与核心环节实现

4.1 从零开始：15分钟部署全流程（含避坑指南）

现在，我们把前面所有理论落地为可执行的步骤。全程基于Windows 11，其他系统逻辑一致，仅路径和命令微调。我会标注每一个可能踩坑的节点，并给出我的实测解决方案。

第一步：安装基础环境（耗时约3分钟）

访问 Python官网，下载Python 3.11.7（当前最新稳定版，完美兼容OpenClaw）。安装时务必勾选Add Python to PATH。
访问 Chrome官网，下载并安装Chrome 115.0.5790.170（注意：不是最新版，是精确版本）。安装完成后，打开Chrome，地址栏输入chrome://version/，确认版本号。
打开命令提示符（Win+R →cmd），执行：
```
pip install openclaw
```
警告：不要用pip install clawdbot！这是另一个同名但不相关的项目，会装错包。OpenClaw的PyPI包名就是openclaw。

第二步：生成初始配置（耗时约2分钟）

在任意目录（比如D:\openclaw）新建文件夹，进入该文件夹。
执行：
```
openclaw init
```
这会生成一个默认的config.yaml。用Notepad++打开它，按前面3.2节的要求，修改phone、allowed_phones、screenshot_path等字段。特别注意：screenshot_path目录必须提前手动创建，否则/screenshot会失败。我习惯建在D:\openclaw\screenshots，然后在配置里写D:\\openclaw\\screenshots（双反斜杠是Python转义要求）。

第三步：首次登录与QR码扫描（耗时约5分钟，成功率95%）

在config.yaml所在目录，执行：
```
openclaw start
```
此时会自动启动Chrome，打开WhatsApp Web登录页，并显示一个巨大的QR码。
关键避坑点来了：
- 如果Chrome窗口是灰色的、没反应，大概率是系统缩放问题。立刻按Ctrl+Shift+Esc打开任务管理器，结束所有chrome.exe进程，然后重新执行openclaw start --chrome-args="--force-device-scale-factor=1"（这个--chrome-args参数是救命稻草）。
- 如果QR码扫了没反应，检查手机WhatsApp是否开启了“WhatsApp Web/Desktop”功能（设置→链接设备）。我遇到过三次，都是因为同事在手机上关闭了这个开关，却以为是电脑端问题。
- 扫码成功后，Chrome会自动跳转到聊天主界面，此时OpenClaw日志会显示✅ WhatsApp connected! Ready to receive commands.。别急着关掉Chrome——它就是OpenClaw的“眼睛”，关了就失联。

第四步：发送第一条指令并验证（耗时约1分钟）

用你白名单里的号码（比如你自己的手机），给你的WhatsApp账号发一条消息：/help。
等待3-5秒，你应该会收到一条格式化的帮助文档，列出所有可用命令。
紧接着发/screenshot。等待10秒左右，你会收到一张图片，这就是你的电脑主屏截图。
实测心得：第一次/screenshot可能稍慢（15秒），因为OpenClaw要初始化PIL库。后续截图都在3秒内完成。如果没收到图，检查screenshot_path目录是否有生成的.png文件——有，说明截图成功，只是回传失败（网络抖动）；没有，说明路径配置错了。

第五步：进阶测试——执行Shell命令（耗时约2分钟）

发送/shell dir D:\openclaw。
你会收到类似这样的文本回复：
```
D:\openclaw 的目录 2023/10/15 14:22 <DIR> . 2023/10/15 14:22 <DIR> .. 2023/10/15 14:22 123 config.yaml 1 个文件 123 字节 2 个目录 123,456,789,012 字节可用
```
这证明Shell执行通道已打通。
注意：/shell默认只返回前100行输出。如果命令输出很长（比如/shell git log），OpenClaw会自动截断，并在末尾加... (output truncated)提示。这是防止单条消息超限被WhatsApp丢弃。

整个流程下来，15分钟是保守估计。我最快的记录是8分23秒——因为跳过了所有“检查版本号”、“创建目录”等前置步骤，直接复制粘贴了配置。但新手按这个流程走，15分钟内搞定，是完全可以预期的。

4.2 自定义命令开发：三步添加一个`/weather`功能

OpenClaw的真正威力，在于你能把它变成专属工作流的一部分。下面以添加/weather命令为例，展示如何在10分钟内扩展功能。这个命令会调用免费的OpenWeatherMap API，返回当前城市天气。

第一步：获取API Key（2分钟）

访问 OpenWeatherMap官网，注册免费账号。
登录后，进入API keys页面，复制你的API key（一串32位字母数字，如a1b2c3d4e5f6g7h8i9j0k1l2m3n4o5p6）。

在config.yaml里新增一段：

weather: api_key: "a1b2c3d4e5f6g7h8i9j0k1l2m3n4o5p6" city: "Beijing"

第二步：编写命令模块（5分钟）

在OpenClaw安装目录（通常是C:\Users\YourName\AppData\Local\Programs\Python\Python311\Lib\site-packages\openclaw\commands）下，新建文件weather.py。

写入以下代码（已做异常处理和缓存）：

import requests import json from datetime import datetime from openclaw.command import command @command("weather", help="查询天气: /weather [city_name]") def weather_command(ctx): # 从配置读取默认城市 default_city = ctx.config.get("weather", {}).get("city", "Beijing") # 获取用户指定的城市，或用默认 city = ctx.args.strip() or default_city # 构造API URL api_key = ctx.config.get("weather", {}).get("api_key") if not api_key: ctx.reply("❌ 天气API未配置，请检查config.yaml") return url = f"http://api.openweathermap.org/data/2.5/weather?q={city}&appid={api_key}&units=metric" try: resp = requests.get(url, timeout=10) resp.raise_for_status() data = resp.json() # 格式化回复 temp = data["main"]["temp"] desc = data["weather"][0]["description"] humidity = data["main"]["humidity"] wind = data["wind"]["speed"] reply = f"🌤️ {city} 天气\n温度: {temp}°C\n天气: {desc}\n湿度: {humidity}%\n风速: {wind} m/s\n更新时间: {datetime.now().strftime('%H:%M')}" ctx.reply(reply) except requests.exceptions.Timeout: ctx.reply("⏰ 天气查询超时，请重试") except requests.exceptions.RequestException as e: ctx.reply(f"❌ 天气查询失败: {str(e)}") except KeyError as e: ctx.reply(f"❌ 数据解析错误: 未找到{e}字段")

这段代码用了requests库（OpenClaw已内置），做了超时、网络异常、JSON解析异常三层保护。关键是ctx.reply()，它会把结果原路发回WhatsApp。

第三步：重启服务并测试（1分钟）

按Ctrl+C停止当前OpenClaw进程。
重新执行openclaw start。
发送/weather Shanghai，几秒后就会收到上海的实时天气。
实测心得：我给销售团队加了这个命令后，他们开会时经常发/weather Guangzhou，确认客户所在地天气，再决定是否安排户外拜访。一个简单的命令，成了他们日常工作的“小助手”。而且，这个weather.py文件可以随时修改、热重载——改完保存，不用重启OpenClaw，下次调用就生效。

5. 常见问题与排查技巧实录

5.1 连接类问题：QR码扫了没反应、登录后频繁掉线

这是新手遇到最多的问题，占所有咨询的73%。我们按现象归类，给出精准排查路径：

现象	可能原因	排查命令/步骤	我的独家解决方案
QR码显示后，手机扫码无反应，Chrome页面一直停留在登录页	Chrome版本过低，或CDP协议不兼容	在Chrome地址栏输入`chrome://version/`，确认版本≥115	下载Chrome 115.0.5790.170离线安装包，手动覆盖安装。不要用Windows Update，它会偷偷降级。
扫码成功，Chrome跳转到聊天页，但OpenClaw日志停在`Connecting to WhatsApp...`，不显示`✅ Connected`	WhatsApp Web的WebSocket连接被公司防火墙拦截	在命令行执行`openclaw start --debug`，观察日志末尾是否有`WebSocket connection failed`	临时关闭公司VPN，或让IT部门放行`web.whatsapp.com`的`wss://`协议。个人用户基本不会遇到。
登录成功，但10-15分钟后自动断连，日志显示`Session expired`	WhatsApp Web会话超时（默认30天），但OpenClaw的会话存储机制有Bug	查看`C:\Users\YourName\.openclaw\session.json`文件是否存在且非空	删除整个`.openclaw`文件夹，重新执行`openclaw start`。这是最干净的解决方式，比修配置快10倍。
断连后，OpenClaw不自动重连，必须手动重启	`config.yaml`里没开启自动重连	检查配置文件，确认有`whatsapp: { auto_reconnect: true }`字段	在`config.yaml`的`whatsapp`节点下，添加`auto_reconnect: true`。这是2023年10月后版本才支持的特性，老教程没提。

提示：所有连接问题，第一步永远是加--debug参数启动。openclaw start --debug会输出详细的WebSocket握手日志，比默认日志多10倍信息，90%的问题看一眼日志就能定位。

5.2 命令执行类问题：指令发了没回复、截图发不出来、Shell命令不执行

这类问题往往和配置或环境强相关，需要逐层剥离：

指令发了，但OpenClaw日志里完全没有记录：
这说明消息根本没进到OpenClaw。原因99%是发信人不在白名单。检查config.yaml里的allowed_phones，确认格式是+8613800138000（无空格、无横杠）。一个快速验证法：用白名单里的号码发/help，如果收到了帮助文档，说明白名单配置正确；如果没收到，那就是号码格式错了。
/screenshot发了，但WhatsApp没收到图，screenshot_path目录里也没有文件：
这是路径配置错误。OpenClaw不会主动创建目录，必须你手动建好。打开文件资源管理器，导航到config.yaml里写的screenshot_path，确认该目录存在。如果不存在，右键新建文件夹，再试一次。我遇到过最离谱的案例：用户写了C:\Users\John\Pictures\clawdbot，但他的用户名其实是Jon（少一个h），结果路径根本不存在，OpenClaw静默失败。
/shell dir返回了结果，但/shell ping baidu.com没反应：
这是shell_whitelist在起作用。ping不在默认白名单里。解决方案：编辑config.yaml，在commands.shell_whitelist列表里加上"ping"，然后重启OpenClaw。记住，所有Shell命令都必须显式加入白名单，这是安全底线。
/file report.pdf发了，但回复“文件不存在”：
file_root限制生效了。OpenClaw会把/file report.pdf解析为C:\Users\YourName\Documents\report.pdf（假设file_root是这个值）。如果文件实际在D:\Projects\report.pdf，就会报错。解决方案：把文件移到file_root目录下，或者修改file_root为D:\Projects。但后者有安全风险，不推荐。

5.3 性能与稳定性问题：CPU占用高、截图模糊、多指令堆积

OpenClaw在后台运行时，偶尔会出现资源占用异常。以下是真实场景下的优化方案：

Chrome进程CPU占用长期>30%：
这是因为OpenClaw默认启用了Chrome的硬件加速，但在某些集成显卡（如Intel HD Graphics 4000）上会引发渲染循环。解决方案：在config.yaml里添加：
```
whatsapp: chrome_args: ["--disable-gpu", "--disable-software-rasterizer"]
```
添加后重启，CPU占用会立刻降到5%以下。这是我给一个用老款ThinkPad T430的客户做的定制优化。
/screenshot截图模糊，文字看不清：
这是DPI缩放导致的。Windows 10/11默认开启“让文本和其他项目更大”，Chrome截图时会按缩放比例渲染，但OpenClaw保存时没做适配。终极解决方案：在config.yaml里加：
```
commands: screenshot_dpi: 100
```
这个参数强制截图按100% DPI渲染，无论系统缩放多少。效果立竿见影，截图和你肉眼看到的一模一样。
同时发3条/screenshot，只有第一条成功，后两条没回复：
这是OpenClaw的防洪机制在工作。默认情况下，它对同一用户每分钟最多处理2条命令，防止误触或恶意刷屏。如果你确实需要高频操作，可以修改config.yaml：
```
security: rate_limit: per_user: 10 window_seconds: 60
```
这样就允许每分钟10次。但请谨慎调整，我建议只在可信的内部团队使用。