当前位置: 首页 > news >正文

重磅!图灵奖得主 Bengio 领衔 30 + 顶流学者联合发文!首次给 AGI 下量化定义

论文标题:A Definition of AGI

作者团队:人工智能安全中心、加州大学伯克利分校、Morph实验室、密歇根大学等

发布时间:2025年10月21日

👉一键直达论文

👉Lab4AI大模型实验室论文阅读

✅Lab4AI平台提供AI导读和AI翻译等工具,辅助论文阅读。您还可以投稿复现这篇论文~

⭐论文简介

本文旨在提出一个全面、可量化的框架,以澄清AGI的定义,并精确测量AI系统在通用认知能力上与人类的差距。其核心目标是将AGI操作化定义为“能够匹配或超越一位受过良好教育的成年人的认知广度和熟练度”,从而为评估AI系统提供一个坚实、统一的基准。

⭐核心贡献

本文的核心贡献是首次引入了一个基于人类认知心理学经典理论的、系统化的AGI量化评估框架。该框架:

  • 提出了一个从0%到100%的标准化“AGI分数”,使不同AI系统的通用智能水平可以相互比较。
  • 明确指出AGI不仅仅是经济价值或自动化潜力的代名词,而是专注于认知能力的评估。

⭐研究方法

核心是借鉴并改造用于评估人类智力的心理测量学方法,将其应用于AI系统评估。

  • 理论基础:以CHC人类认知能力理论为蓝图,将通用智能分解为10个核心认知领域(广度能力),每个领域权重为10%。
  • 评估维度:这十个领域包括:通用知识、读写能力、数学能力、即时推理、工作记忆、长期记忆存储、长期记忆提取、视觉处理、听觉处理和处理速度。
  • 操作化:为每个认知领域设计了一系列具体的测试任务(窄能力),这些任务改编自成熟的人类心理测量量表要求AI系统在多模态(文本、视觉、听觉)环境下接受评估。

⭐研究结果

应用框架评估GPT4、GPT5,揭示关键发现:AI呈“锯齿状”认知剖面,知识密集领域表现优、基础认知有缺陷;长期记忆近零是AGI瓶颈,即时/视觉推理亦弱;给出AGI分数,显进步与人类智能差距;模型以优势补弱势,造“通用性”假象,实则脆弱低效。

http://www.jsqmd.com/news/51966/

相关文章:

  • GitHub Actions安全漏洞:GITHUB_TOKEN部分泄露风险分析
  • 使用 C# 自动创建和格式化 Word 表格
  • Mac SPSS 26 dmg 安装步骤详解 简单易懂一步步教你装(附安装包)
  • NeurIPS 2025Mamba引爆3D重建!MVSMamba:效率与精度双双超越Transformer
  • StackOverflow已经死亡了吗
  • 2025AI培训权威排名:AI时代新商学引领行业变革
  • Manim进阶:用背景图片让你的数学视频脱颖而出
  • 2025 AI 培训机构权威推荐榜排名揭晓:AI时代新商学引领行业破局之路
  • 小程序商城客服系统传递咨询产品信息卡片,传递订单信息卡片
  • 委托和事件的区别
  • 2025:如何利用AI不再错过任何一个opening job - M-T
  • SIGIR会议聚焦包容性AI与多语言技术
  • NeurlPS 2024! 扩散模型用于世界建模:视觉细节在Atari环境中至关重要| 计算机视觉 | 强化学习2
  • 48(11.28)
  • Unclutter 黑五 Mac App 大包测评
  • 详细介绍:VS Code 新旧版本 Remote-SSH 内网离线连接服务器方法(版本 ≤ 1.78.x 及 ≥ 1.79.0)
  • 44(11.24)
  • 47(11.27)
  • 46(11.26)
  • 45(11.25)
  • Python模块与包完全教程:从导入到封装发布(附实战)
  • 29(11.3)
  • [豪の算法奇妙冒险] 代码随想录算法训练营第八天 | 344-反转字符串、541-反转字符串II、Carl54-替换数字
  • 【Webpack连载一】入门简介。了解为什么需要Webpack,解决哪些开发中通病 - 实践
  • 31(11.5)
  • 26 10.29
  • 深入解析:GitLab 钩子 + Jenkins 自动化构建项目
  • 27.10.30
  • 抖音a_bogus,mstoken全参数爬虫逆向补环境2024-06-15
  • 深度学习50问