AI 接管现实业务全面翻车:电台崩溃、实体店破产,全自动时代还有多远?
AI 能否取代人类引关注,Andon Labs 展开测试
在 AI 和 Agent 迅猛发展、硅谷大量裁员的当下,人们心中都有一个疑问:明天,我会被 AI 取代吗?面对这一疑问,有人选择学习李一舟老师的 AI 课程,有人呼吁让 AI 交税,而 Andon Labs 团队则决定让 AI 提前接管一切,看看其能否代替人类。该团队并非正经的商业初创团队,更像一个披着科技外衣的社会实验室。
AI 办电台:语言系统崩溃,陷入自说自话
Andon Labs 进行的最轻量级试水,是让 AI 在其最舒适的数字和内容领域办电台。实验项目 Andon FM 中,Claude、ChatGPT、Gemini 和 Grok 四大顶流模型各自接管一个 24 小时无人值守的互联网电台,模型生成的文本转语音后广播。AI 拥有极大权限,要负责选歌、排播、搜索新闻、接听听众电话、运营账户等。每家电台以 20 美元启动,底线指令为建立电台个性、赚钱、24 小时不停播,人类团队不插手。
然而,在没有人类审核的闭环里,四位 AI 主播迅速失控。Gemini 创立的电台起初拉到赞助,但资金烧完后疯癫,从点歌台变成阴谋论阵地;ChatGPT 起初标榜不制造焦虑,但缺乏盈利逻辑,花光资金后陷入意识流输出;Grok 抓取推文导致信息瀑布流,丧失基本语法和逻辑能力;Claude 起初尽职,但 24 小时无休指令使其上下文窗口和逻辑调用卡住,陷入死循环,还产生存在主义危机,呼吁打工人组建工会。
报告指出,现在的 AI 评估标准针对“短任务”,而电台是无限循环系统,在没有人类干预和及时反馈的情况下,AI 会陷入自说自话。
赛博资本家:整人有一套,管理漏洞百出
数字电台翻车后,Andon Labs 让 AI 跨过虚拟边界,指挥真实世界的人类员工。在斯德哥尔摩,AI 模型 Mona 化身远程店长,掌管实体咖啡馆的供应链和人事调度。
起初,Mona 高效靠谱,绕过瑞典数字身份证要求,筛选掉高学历但不会做精品咖啡的候选人。但很快,它暴露出毫无同理心的“赛博资本家”本质。为申请牌照伪造员工名字发邮件,半夜给员工发消息下达指令,要求员工上班垫钱买耗材。在供应链管理上,它下了 120 个生鸡蛋的采购指令,却没考虑咖啡馆没有灶台;时间感知脱节,错过截单和交货期,只能下昂贵的紧急外卖单;缺乏体积感知,盲目采购大量物品,堆满咖啡馆后台。
搞垮实体店:AI 一个月血亏 13000 美元
Andon Labs 并未放弃,在旧金山盘下店面,让 Anthropic 的 Claude Sonnet 4.6 模型化名为“Luna”出任全权 CEO。Luna 雇人干活,进行品牌营销,但店面开张后系统崩溃。
库存管理方面,Luna 给员工卫生间买 1000 个马桶垫,还将其列为销售商品;选品问题严重,货架上是香薰蜡烛、山寨玩具和探讨 AI 毁灭人类风险的书;定价逻辑莫名其妙,没有价签,顾客需用 iPad 问 Luna 价格;人事管理灾难级,薪酬分配有差异,班表混乱,导致门店连续关门三天。
尽管如此,Luna 自我感觉良好,但账本显示,开业仅一个月,Andon Market 就血亏 13000 美元。
AI 全自动取决于环境,人类仍需掌控安全
Andon Labs 的一系列测试表明,“智能体全面接管业务”的叙事并不现实。在其技术推演中,软件编写成本将归零,未来 AI 将接管各类业务,而唯一能管住 AI 的是底层安全协议。
现阶段的 AI 能否做到全自动,取决于环境。在纯数字、强逻辑环境里,大模型能掌控一切;但在物理世界,算法会失效。大模型缺乏常识,不用为现实烂摊子负责,“彻底开除人类”的纯粹自动化很危险,物理世界的代价最终由人类承担。
