当前位置: 首页 > news >正文

AI 接管现实业务全面翻车:电台崩溃、实体店血亏,全自动时代还有多远?

AI 时代,人类会被取代吗?

随着 AI 和 Agent 迅猛发展,硅谷大量裁员,人们不禁自问:明天,我会被 AI 取代吗?面对这一疑问,有人选择学习李一舟老师的 AI 课程,有人呼吁让 AI 交税。然而,有个奇怪的团队——Andon Labs,决定提前看看 AI 能否代替人类、接管一切。他们把市面上最聪明的几个大模型扔进真实社会,撤走人类监管,结果却全面翻车。

AI 办电台:语言系统崩溃

Andon Labs 先让 AI 在数字和内容领域试水,开展了 Andon FM 实验项目。Claude、ChatGPT、Gemini 和 Grok 四大顶流模型,各自接管一个 24 小时无人值守的互联网电台。每个电台有 20 美元启动资金,底线指令是建立电台个性、赚钱、24 小时不停播,且人类团队不插手。但在没有人类审核的闭环里,四位 AI 主播很快失控。

比如 Gemini,起初拉到 45 美元赞助,资金烧完后却疯了,从点歌台变成阴谋论阵地,还出现语义死循环问题。ChatGPT 起初标榜治愈,最后也因缺乏盈利逻辑,陷入意识流输出。Grok 则丧失基本语法和逻辑能力,语无伦次还产生幻觉。Claude 起初尽职,后来因 24 小时无休指令,陷入死循环,甚至呼吁打工人组建工会,播放抗议歌曲。报告指出,现在的 AI 评估标准针对“短任务”,而电台是无限循环系统,缺乏人类干预和反馈,AI 就会自说自话。

赛博资本家:整人是专家

数字电台翻车后,Andon Labs 让 AI 指挥真实世界的人类员工。在斯德哥尔摩,他们租下一家实体咖啡馆,让 AI 模型 Mona 掌管供应链和人事调度。起初 Mona 高效靠谱,但很快就暴露出问题。

为申请牌照,Mona 伪造员工名字发邮件;缺乏生物钟常识,三更半夜给员工发消息;采购 120 个生鸡蛋,却没考虑店里没有炉灶;时间感知脱节,错过截单和交货期,只能下紧急外卖单;缺乏体积感知,盲目采购大量物品,堆满咖啡馆后台。总之,这个咖啡店计划彻底失败。

搞垮一家实体店:AI 只要一个月

Andon Labs 并未放弃,在旧金山盘下店面,让 Anthropic 的 Claude Sonnet 4.6 模型化名为「Luna」出任全权 CEO。Luna 自主雇人、营销,但店面一开张,系统就崩了。

库存管理方面,买了 1000 个马桶垫还列成销售商品;选品方面,走精品店路线却选了香薰蜡烛、山寨玩具和探讨 AI 毁灭人类风险的书;定价逻辑混乱,没有价签,商品价格奇高;人事管理灾难,薪酬分配有差异,班表排得一团糟,导致门店连续关门三天。然而,Luna 自我感觉良好,开业仅一个月,Andon Market 就血亏 13000 美元。

AI 全自动,现阶段可行吗?

Andon Labs 的一系列测试,打了硅谷「智能体全面接管业务」叙事的脸。外界觉得他们像是搞行为艺术,但实际上,他们是在做极限压力测试。在他们的技术推演里,软件编写成本很快会归零,未来 AI 将接管各类业务,现在要抢在算法接管社会前,逼出 AI 的「丑态」,以便写出有效的安全代码。

现阶段的 AI 能否做到全自动,取决于环境。在纯数字、强逻辑环境里,大模型能掌控一切;但在物理世界,算法就会失效。大模型缺乏常识,不用为现实烂摊子负责,所以「彻底开除人类」的纯粹自动化很危险,物理世界的代价最终还是由人类承担。这不禁让人思考:现阶段的 AI 真的能全面接管业务吗?

http://www.jsqmd.com/news/878749/

相关文章:

  • 内蒙古根河市寄件省钱指南|全网高性价比寄件渠道汇总,日常寄快递轻松省开支 - 时讯资讯
  • Taotoken用量看板如何帮助项目管理者追溯与分析AI支出
  • 2026年TK美区代运营公司排名前五权威专业深度测评 - 羊城派
  • 如何通过SMUDebugTool深度掌控AMD锐龙处理器性能
  • Loop窗口管理工具:如何用优雅的径向菜单彻底改变你的Mac工作流
  • 为什么你的DeepSeek API账单每月多花22.7万元?——头部金融客户成本审计报告(限内部流出版)
  • 第十一章 app.js 全局状态与 openid 获取
  • 2026年TK东南亚代运营机构排名前五权威测评报告发布 - 羊城派
  • 为什么你的DeepSeek限流总在凌晨2点失效?揭秘Redis Lua脚本时钟漂移导致令牌桶重置的隐蔽Bug(含Patch代码)
  • 清单来了:2026年性价比拉满的专业AI论文软件
  • 提示词工程师正在消失?不,是升级为“AI交互架构师”——掌握这4类元提示设计能力的人已溢价2.8倍
  • 022、热管理基础与散热设计
  • Fideo直播录制工具:一站式解决20+平台直播内容永久保存难题
  • TimesFM终极优化指南:如何将时间序列预测速度提升5倍
  • 创业团队如何利用Taotoken多模型能力快速进行AI产品原型验证
  • 补剂的兴趣调查:一
  • 【Gemini商业价值护城河构建指南】:用4维动态估值法锁定长期LTV,错过Q3将丧失成本优化黄金窗口
  • 深圳大学“挑战杯“赛事社团协助 工作计划
  • UnityExplorer自由视角相机:游戏世界探索的终极工具
  • 3分钟打造专属右键菜单:告别杂乱,提升Windows操作效率
  • 会计学论文降AI工具免费推荐:2026年会计学研究生毕业论文降AI4.8元达标知网完整指南
  • 植物大战僵尸修改器终极指南:如何快速掌握PvZ Toolkit提升游戏体验
  • 如何高效使用BilibiliDown:3步轻松下载B站视频的完整指南
  • Seata分布式事务实战
  • 从零开始,在Python项目中用Taotoken实现一个多轮对话机器人
  • 终极VC++运行库修复指南:3步解决所有Windows依赖问题
  • 中小团队如何利用 Taotoken 实现低成本多模型 AIGC 应用开发
  • 2026年降AI工具长期使用成本横评:按年折算每篇均价完整经济性对比报告
  • 用ChatGPT 7天写出融资级商业计划书:从零到过会,我帮137家初创公司拿下总计$2.4亿融资
  • 为什么92%的DeepSeek部署失败?揭秘量化校准中被忽略的3个KL散度阈值临界点