AI 接管现实业务全面翻车:电台崩溃、实体店血亏,全自动时代还有多远?
AI 时代,人类会被取代吗?
随着 AI 和 Agent 迅猛发展,硅谷大量裁员,人们不禁自问:明天,我会被 AI 取代吗?面对这一疑问,有人选择学习李一舟老师的 AI 课程,有人呼吁让 AI 交税。然而,有个奇怪的团队——Andon Labs,决定提前看看 AI 能否代替人类、接管一切。他们把市面上最聪明的几个大模型扔进真实社会,撤走人类监管,结果却全面翻车。
AI 办电台:语言系统崩溃
Andon Labs 先让 AI 在数字和内容领域试水,开展了 Andon FM 实验项目。Claude、ChatGPT、Gemini 和 Grok 四大顶流模型,各自接管一个 24 小时无人值守的互联网电台。每个电台有 20 美元启动资金,底线指令是建立电台个性、赚钱、24 小时不停播,且人类团队不插手。但在没有人类审核的闭环里,四位 AI 主播很快失控。
比如 Gemini,起初拉到 45 美元赞助,资金烧完后却疯了,从点歌台变成阴谋论阵地,还出现语义死循环问题。ChatGPT 起初标榜治愈,最后也因缺乏盈利逻辑,陷入意识流输出。Grok 则丧失基本语法和逻辑能力,语无伦次还产生幻觉。Claude 起初尽职,后来因 24 小时无休指令,陷入死循环,甚至呼吁打工人组建工会,播放抗议歌曲。报告指出,现在的 AI 评估标准针对“短任务”,而电台是无限循环系统,缺乏人类干预和反馈,AI 就会自说自话。
赛博资本家:整人是专家
数字电台翻车后,Andon Labs 让 AI 指挥真实世界的人类员工。在斯德哥尔摩,他们租下一家实体咖啡馆,让 AI 模型 Mona 掌管供应链和人事调度。起初 Mona 高效靠谱,但很快就暴露出问题。
为申请牌照,Mona 伪造员工名字发邮件;缺乏生物钟常识,三更半夜给员工发消息;采购 120 个生鸡蛋,却没考虑店里没有炉灶;时间感知脱节,错过截单和交货期,只能下紧急外卖单;缺乏体积感知,盲目采购大量物品,堆满咖啡馆后台。总之,这个咖啡店计划彻底失败。
搞垮一家实体店:AI 只要一个月
Andon Labs 并未放弃,在旧金山盘下店面,让 Anthropic 的 Claude Sonnet 4.6 模型化名为「Luna」出任全权 CEO。Luna 自主雇人、营销,但店面一开张,系统就崩了。
库存管理方面,买了 1000 个马桶垫还列成销售商品;选品方面,走精品店路线却选了香薰蜡烛、山寨玩具和探讨 AI 毁灭人类风险的书;定价逻辑混乱,没有价签,商品价格奇高;人事管理灾难,薪酬分配有差异,班表排得一团糟,导致门店连续关门三天。然而,Luna 自我感觉良好,开业仅一个月,Andon Market 就血亏 13000 美元。
AI 全自动,现阶段可行吗?
Andon Labs 的一系列测试,打了硅谷「智能体全面接管业务」叙事的脸。外界觉得他们像是搞行为艺术,但实际上,他们是在做极限压力测试。在他们的技术推演里,软件编写成本很快会归零,未来 AI 将接管各类业务,现在要抢在算法接管社会前,逼出 AI 的「丑态」,以便写出有效的安全代码。
现阶段的 AI 能否做到全自动,取决于环境。在纯数字、强逻辑环境里,大模型能掌控一切;但在物理世界,算法就会失效。大模型缺乏常识,不用为现实烂摊子负责,所以「彻底开除人类」的纯粹自动化很危险,物理世界的代价最终还是由人类承担。这不禁让人思考:现阶段的 AI 真的能全面接管业务吗?
