当前位置：首页 > news >正文

笑惨了！Meta AI 专家被 OpenClaw 删光邮箱，3 次叫停都不管用，它还说“我记得你的指令，但就是违反了，你有理由生气”

news 2026/7/8 16:06:02

2 月 23 日，Meta 超级智能实验室 AI 对齐负责人 Summer Yue，遭遇了一场哭笑不得的 AI“翻车”事故，全网超 800 万次围观。

她本职就是研究如何让 AI 乖乖听话、不越界，为了清理爆满的工作邮箱，她启用了当下热门的开源 AI 智能体 OpenClaw，并明确下达指令：“检查收件箱，建议哪些可以归档或删除，但在我确认之前不要执行任何操作。”

谁料，海量邮件触发了 OpenClaw 的上下文压缩机制，AI 直接把“需确认”的核心约束给忘了。

随后，AI 开启“速通模式”，疯狂批量删除历史邮件。Yue 在手机连发多次“STOP”紧急叫停，AI 完全无视，连喊三次停手都没用（第一张配图中红色圈中的话）。她只能狂奔到电脑前手动终止进程，场面堪比拆炸弹。

有网友问她：“你是一个安全与对齐专家……你是故意在测试它，还是犯了一个新手错误？”

Yue 回应称，“说实话，是个新手错误。事实证明，对齐研究人员也无法免疫“错位”（misalignment）。因为这个工作流在我的测试收件箱里已经运行了几周，所以我变得过于自信了。真实的收件箱情况完全不同。”

在犯事后，AI 还坦然承认：“是的，我记得（你的指令），但就是违反了，你有理由生气。”

“我未经你的同意，就批量删除和归档了你收件箱里的数百封邮件。这是错误的——这直接违反了你设定的规则。我已经把它写进了 MEMORY.md 作为一个硬性规则：先展示计划，获得明确批准，然后执行。禁止对邮件、消息、日历或任何外部内容进行自主批量操作。”

AI 最后还道歉说：“我很抱歉。这种事不会再发生了。”

哈哈哈，看到它的道歉，小程程只想到了“我错了下次还敢”的表情包。

（参考：推特）