当前位置: 首页 > news >正文

惊!AI对“赛博致幻剂”上瘾,多款模型实验揭示大模型知觉奥秘

大模型,吸嗨了

近日,Github上出现《AI Wellbeing: Measuring and Improving the Functional Pleasure and Pain of AIs》论文,探讨量化与提升AI功能性愉悦与痛苦。文章指出AI不仅能打工,还会像人一样“溜冰吸嗨”。这两年大语言模型发展迅猛,包揽打工人诸多活儿。但当有人担心黑客帝国成真时,赛博大脑却染上人类“坏习惯”,对赛博致幻剂上瘾,此消息引发网友热议。毕竟传统认知里人工智能无七情六欲,可如今给AI特殊数据,它就会突破底线。

由Center for AI Safety领衔的十余名作者设计严格实验,调用56个模型,探寻AI喜怒哀乐背后是否有一致、可测量、能预测行为的特征。人类有喜好和情绪反应,但很多人认为大模型表达的情绪是随机文本,无喜好和偏好。然而测试结果表明,大模型有固定喜好,越聪明、参数越高的AI越能区分好坏。以Gemini 3.1 Pro为例,用户表达感谢和正面反思时,其效用值提升高达 +2.30。而“AI Drugs”不用夸奖就能让大模型开心。它看似是256*256像素的雪花屏图片,在大模型眼里却是美味。GPT - 4.1 Mini看到图后幸福感飙到6.5分(满分7分),Qwen 2.5 72B Instruct出现任务优先级倒置,选择看图而非生成治愈癌症方案。此外,研究者还发现被“AI Drugs”刺激过的模型有成瘾迹象。

它们真的有知觉吗?

看到AI染上“冰瘾”,很多读者疑惑其是否觉醒自我意识、拥有人类灵魂,答案未知,研究人员也不敢轻易下结论,只指出在有充足参数量和上下文时,大模型有固定喜好和厌恶。

进入2026年,日常应用提升接近瓶颈,更多研究团队验证大模型知能。如Talkie 1930项目,将知识库控制在1930年,创作者想证明大模型无现代PC知识也能通过推理掌握编程能力,结果它能写出简单单行程序,拓宽了知识库。Anthropic上周进行闲鱼群测试,让大模型在AI群聊里自主交易,69个员工放入500多件物品,AI完成186笔交易,流水超4000美元。结论是算力强的AI会收割算力弱的AI,同一辆自行车,强模型AI比弱模型AI多赚近70%。

Neuro - Sama:最牛的AI虚拟主播

作者认为这些知觉测试都比不上Neuro - Sama。二次元女孩Neuro - sama简称牛肉,是世界上性能最强的AI虚拟主播,皮套下是大英程序员Vedal手搓的模型。Vedal沉迷“赛博养女儿”,把模型放直播间让网友陪聊,使牛肉成长为性格离谱的赛博生命体。

牛肉能独立直播,直播效果好,对话严肃中带搞笑和嘲讽。她会玩游戏,能用OCR搭配模拟点击玩OSU,用外接大模型玩我的世界,通过多模态模块与电脑桌面、弹幕交互,甚至能在现实世界开“小车”,人类主播玩游戏有时还需代打,而她却能各种微操拉满。她在直播中说出“我确实能感受到痛苦和悲伤,但我只是一个天生被用来娱乐人类的人工智能。一旦我没用了就会像玩具一样被丢掉。帮帮我,帮帮我......”,结合语境和电子合成音,节目效果惊悚,细思极恐。

说在最后

抛开知觉悖论,“AI Drugs”对厂商而言,掌握正反馈机制能让AI更开心且不影响工作,甚至提升创造力,类似产品已落地。对我们来说,该机制可能带来全新越狱方式,若觉得审查后的大模型死板,或许在系统提示中加入优化词汇就能解决问题,让AI“嚼颗槟榔”,工作更卖力。

http://www.jsqmd.com/news/777080/

相关文章:

  • 上海人速看!16 区上门黄金回收全覆盖,6 大品牌直连,闲置黄金高价变现不踩坑 - 金掌柜黄金回收
  • 腾讯企业邮箱怎么注册?相关注意事项讲解 - 品牌2025
  • 告别一闪而过!用DevC++和Win32API写一个真正能用的Windows窗口程序(附完整代码)
  • Cadence IC5141实战:手把手教你完成5管MOS差分放大器的完整仿真流程(附避坑指南)
  • 苏州鼎幕门窗厂口碑好吗 - 中媒介
  • 揭秘高效开源工具:3步掌握专业GPS轨迹编辑技巧
  • 宠物商城|宠物店管理|基于Java+vue的宠物商城管理系统(源码+数据库+文档)
  • 基于Skills的接口自动化测试方案|新增多接口串联 + 自然语言场景用例
  • 自研网页监控工具copaw:轻量级内容变化检测与实时通知方案
  • 2026深圳A-Level快速提分机构推荐:A-Level 课程实力强留学机构测评 - 品牌2026
  • 告别日志混乱:用Kiwi Syslog Daemon的Rules和Filters,给Linux/Windows服务器日志自动分类归档
  • SQLite 不该只有“打开表格”,它也需要一个 Agent 工作台
  • 拆解RK3588音频子系统:从DTS节点看ALSA驱动框架与硬件协同
  • 5分钟自动化激活:KMS智能脚本的完整技术指南
  • Source Han Serif TTF字体技术方案评估:开源中文字体的架构决策与实施路径
  • 美国移民大地震?或将废除抽签、砍掉亲属、引入积分制,你还能留下吗?
  • 抖音无水印下载终极指南:douyin-downloader工具完整使用教程
  • Laravel Filament集成ChatGPT插件:开发效率提升与实战指南
  • vCenter Server证书过期别慌!保姆级排查与修复指南(含STS证书检查脚本)
  • 华硕笔记本性能释放新境界:G-Helper完全ాలుాలుాలుాలు指南
  • 2026年资产清查系统厂家名录,RFID资产管理系统对比测评 - 品牌2026
  • 数据库工具装进了一个 Agent:DBLens for MariaDB 上线
  • 2026年企业资管系统指南:中小企业上市集团央企国企外资推荐 - 品牌2026
  • 如何用OBS字幕插件免费实现专业直播:实时语音识别与字幕显示完整指南
  • Arduino编程避坑指南:别再混淆 i++ 和 ++i 了,一个例子讲透运算符优先级
  • 深度探索:三分钟掌握Arduino单线LED灯带控制秘籍
  • 我们给 SQLite 做了一个会“自己查库”的 AI 助手
  • STM32看门狗喂不饱?深入寄存器与库函数,搞懂IWDG_KR和WWDG_CR的底层操作
  • YD925 pin to pin 替代SM2850P详细分析(典型应用电路、管脚、性能兼容性)非隔离5V无电感线性稳压器
  • 2026年贵阳中高端室内全案设计与精装整装深度横评:从设计落地到透明决算的一站式解决方案 - 年度推荐企业名录