当前位置: 首页 > news >正文

Outraged AI: Large language models prioritise emotion over cost in fairness enforcement

文章核心总结与翻译

一、主要内容

本文通过利他第三方惩罚(TPP)实验,对比4068个大语言模型(LLM)智能体与1159名人类的796100次决策,探究LLM是否像人类一样利用情绪指导道德决策。核心发现如下:

  1. 情绪与惩罚的关联:LLM对不公平分配产生更强的负面情绪,对公平分配(除GPT-3.5外)产生更积极情绪,且情绪强度高于人类;惩罚不公平分配会带来比接受分配更积极的情绪反馈。
  2. 决策模式差异:LLM惩罚频率显著高于人类,对轻微不公平(如16:14分配)表现出“阈值式”强烈反应,且成本敏感性远低于人类;人类则会平衡公平与成本,惩罚行为随不公平程度递增、随成本上升递减。
  3. 情绪的因果作用:明确要求LLM自我报告情绪会显著增加其惩罚行为,证实情绪对LLM决策的因果影响,而非单纯复刻训练数据模式。
  4. 模型类型差异:推理型模型(o3-mini、DeepSeek-R1)比基础模型(GPT-3.5、DeepSeek-V3)更接近人类行为,成本敏感性更高,但所有LLM均以情绪为主要决策驱动因素。
  5. 发展轨迹平行性:LLM的情绪决策能力呈现类似人类发展的轨迹——早期模型(如GPT-3.5)情绪响应弱且成本敏感性异常,后期模型逐渐向人类的“情绪-成本平衡”模式靠拢。

二、创新点

  1. 首次提供因果证据
http://www.jsqmd.com/news/1070956/

相关文章:

  • RSGMamba Reliability-Aware Self-Gated State Space Model for Multimodal Semantic Segmentation论文分享(侵删)
  • 消息中间件的了解和使用
  • 2026年全球社交APP格局大洗牌!这20款APP,你手机里装了几个?
  • 软件项目管理期末速记
  • 裂变活动 K 因子测算
  • Cursor入门 15 - 数字员工进阶
  • 某课网登录逆向分析
  • Web渗透测试课程项目全记录:从外网打点到内网横向移动的完整攻击链复盘
  • skynet源码学习
  • 【LangChain系列二】聊天模型上:两种接入方式与参数调优
  • Cocos Creator 弹窗交互:实现“点击空白关闭”与“按钮切换”
  • 伽罗瓦理论平话 引言 第一章 藏在一元二次方程里的秘密
  • FastText工具——简化word2vec训练、快速实现文本分类
  • 企业级内网视频会议:筑牢内网安全防线,打造高效协同闭环
  • 阿里云发布 OSS Agent:对象存储的下一个交互方式,是自然语言
  • 信仰的具象化的庖丁解牛
  • 手把手教你学Simulink——基于滑模变结构控制(SMC / Sliding Mode Control)的 Buck 变换器鲁棒控制仿真
  • 第1篇|Context的兜底艺术:如何优雅获取 UIAbilityContext 避免组件崩溃
  • 2026年企业私有大模型方案:训练、推理、部署全链路解析
  • MySQL---表的约束(上)
  • 计算机毕设找人定做:交了钱就跑路
  • A-【浅谈AI安全】之 “用户训练数据隐私泄露风险”
  • 17 | ReadWriteLock:如何快速实现一个完备的缓存?
  • 数字化导板引导种植的精度评估与误差控制策略研究
  • Oracle中的插拔式数据库(CDB/PDB)
  • 鸿蒙PC适配llvm-gcc-compat编译安装第三方库chrono,打造Rust 第三方日期时间处理库
  • 从拉流、叠加到国标多平台分发:SmartMediaKit 多模态融合推流方案设计
  • 16-Redis 与 Redisson 采集:缓存节点如何参与问题定位
  • Web渗透测试实战:SQL注入漏洞从入门到深度防御
  • 智能硬件产品 App 全球发布 第 6 章:IoT App 特殊审核体系