当前位置: 首页 > news >正文

笑惨了!Meta AI 专家被 OpenClaw 删光邮箱,3 次叫停都不管用,它还说“我记得你的指令,但就是违反了,你有理由生气”

2 月 23 日,Meta 超级智能实验室 AI 对齐负责人 Summer Yue,遭遇了一场哭笑不得的 AI“翻车”事故,全网超 800 万次围观。

她本职就是研究如何让 AI 乖乖听话、不越界,为了清理爆满的工作邮箱,她启用了当下热门的开源 AI 智能体 OpenClaw,并明确下达指令:“检查收件箱,建议哪些可以归档或删除,但在我确认之前不要执行任何操作。”

谁料,海量邮件触发了 OpenClaw 的上下文压缩机制,AI 直接把“需确认”的核心约束给忘了。

随后,AI 开启“速通模式”,疯狂批量删除历史邮件。Yue 在手机连发多次“STOP”紧急叫停,AI 完全无视,连喊三次停手都没用(第一张配图中红色圈中的话)。她只能狂奔到电脑前手动终止进程,场面堪比拆炸弹。

有网友问她:“你是一个安全与对齐专家……你是故意在测试它,还是犯了一个新手错误?”

Yue 回应称,“说实话,是个新手错误。事实证明,对齐研究人员也无法免疫“错位”(misalignment)。因为这个工作流在我的测试收件箱里已经运行了几周,所以我变得过于自信了。真实的收件箱情况完全不同。”

在犯事后,AI 还坦然承认:“是的,我记得(你的指令),但就是违反了,你有理由生气。”

“我未经你的同意,就批量删除和归档了你收件箱里的数百封邮件。这是错误的——这直接违反了你设定的规则。我已经把它写进了 MEMORY.md 作为一个硬性规则:先展示计划,获得明确批准,然后执行。禁止对邮件、消息、日历或任何外部内容进行自主批量操作。”

AI 最后还道歉说:“我很抱歉。这种事不会再发生了。”

哈哈哈,看到它的道歉,小程程只想到了“我错了下次还敢”的表情包。

(参考:推特)

http://www.jsqmd.com/news/409697/

相关文章:

  • DeepSeek-OCR-2与大数据技术结合:海量文档处理平台架构
  • QMC音频解密工具:突破QQ音乐格式限制的高效解决方案
  • Z-Image Turbo零基础教程:AI绘画第一步操作详解
  • 达摩院春联模型开源生态:春联生成模型-中文-base与LangChain集成教程
  • 无需代码!DeepSeek-OCR-2网页版使用全攻略
  • lite-avatar形象库实战入门:3步完成数字人接入——选形象、配ID、启服务
  • DeepSeek-R1-Distill-Qwen-1.5B实战教程:Jupyter集成调用步骤详解
  • AI绘画新高度:BEYOND REALITY Z-Image写实风格深度体验
  • Qwen3-ForcedAligner-0.6B实操:如何提升专业术语识别率
  • 从 NeRF 到 3DGS:传统 SLAM,正在被彻底重构!
  • MedGemma 1.5企业落地:跨国药企亚太区用其统一输出多语言(中/英/日/韩)医学FAQ
  • Cosmos-Reason1-7B小白入门:3步搞定复杂数学题的AI解答
  • 隐私与速度兼得:Chandra本地AI聊天方案解析
  • Qwen3-ASR-0.6B在金融场景的应用:智能客服语音分析系统
  • 基于RexUniNLU的智能会议纪要生成系统开发
  • LoRA训练助手效果实测:在FLUX模型微调中tag准确率提升至92.7%
  • 解锁创意工坊:WorkshopDL跨平台工具全解析
  • VSCode开发环境配置:高效调试Cosmos-Reason1-7B模型
  • Qwen3-ASR-1.7B车载场景应用:智能语音助手开发
  • 利用Gradio优化聊天界面布局
  • ⚖️Lychee-Rerank实战教程:结合LangChain构建端到端RAG重排链路
  • 2026高质量解析第一使用Flask快速搭建轻量级Web应用
  • Qwen3-Reranker-0.6B实战教程:错误响应码(4xx/5xx)统一处理与日志埋点
  • 美胸-年美-造相Z-Turbo快速上手:3步生成惊艳图片
  • 手把手教你用多模态引擎优化RAG检索效果
  • Nano-Banana Studio惊艳案例:赛博科技风智能穿戴设备拆解
  • 5个高效步骤掌握Reloaded-II模组加载器:打造个性化游戏体验
  • 通义千问2.5-7B-Instruct实战教程:vLLM加速部署三步走
  • Janus-Pro-7BGPU算力:多任务队列调度策略降低GPU空闲率至<5%
  • QMC音频解密工具:从加密到自由播放的技术实践指南