当前位置：首页 > news >正文

重磅！图灵奖得主 Bengio 领衔 30 + 顶流学者联合发文！首次给 AGI 下量化定义

news 2026/7/5 0:16:29

论文标题：A Definition of AGI

作者团队：人工智能安全中心、加州大学伯克利分校、Morph实验室、密歇根大学等

发布时间：2025年10月21日

👉一键直达论文

👉Lab4AI大模型实验室论文阅读

✅Lab4AI平台提供AI导读和AI翻译等工具，辅助论文阅读。您还可以投稿复现这篇论文~

⭐论文简介

本文旨在提出一个全面、可量化的框架，以澄清AGI的定义，并精确测量AI系统在通用认知能力上与人类的差距。其核心目标是将AGI操作化定义为“能够匹配或超越一位受过良好教育的成年人的认知广度和熟练度”，从而为评估AI系统提供一个坚实、统一的基准。

⭐核心贡献

本文的核心贡献是首次引入了一个基于人类认知心理学经典理论的、系统化的AGI量化评估框架。该框架：

提出了一个从0%到100%的标准化“AGI分数”，使不同AI系统的通用智能水平可以相互比较。
明确指出AGI不仅仅是经济价值或自动化潜力的代名词，而是专注于认知能力的评估。

⭐研究方法

核心是借鉴并改造用于评估人类智力的心理测量学方法，将其应用于AI系统评估。

理论基础：以CHC人类认知能力理论为蓝图，将通用智能分解为10个核心认知领域（广度能力），每个领域权重为10%。
评估维度：这十个领域包括：通用知识、读写能力、数学能力、即时推理、工作记忆、长期记忆存储、长期记忆提取、视觉处理、听觉处理和处理速度。
操作化：为每个认知领域设计了一系列具体的测试任务（窄能力），这些任务改编自成熟的人类心理测量量表要求AI系统在多模态（文本、视觉、听觉）环境下接受评估。

⭐研究结果

应用框架评估GPT4、GPT5，揭示关键发现：AI呈“锯齿状”认知剖面，知识密集领域表现优、基础认知有缺陷；长期记忆近零是AGI瓶颈，即时/视觉推理亦弱；给出AGI分数，显进步与人类智能差距；模型以优势补弱势，造“通用性”假象，实则脆弱低效。

查看全文

http://www.jsqmd.com/news/51966/

GitHub Actions安全漏洞：GITHUB_TOKEN部分泄露风险分析

使用 C# 自动创建和格式化 Word 表格

Mac SPSS 26 dmg 安装步骤详解简单易懂一步步教你装（附安装包）

NeurIPS 2025Mamba引爆3D重建！MVSMamba：效率与精度双双超越Transformer

StackOverflow已经死亡了吗

2025AI培训权威排名：AI时代新商学引领行业变革

Manim进阶：用背景图片让你的数学视频脱颖而出

2025 AI 培训机构权威推荐榜排名揭晓：AI时代新商学引领行业破局之路

小程序商城客服系统传递咨询产品信息卡片，传递订单信息卡片

委托和事件的区别

2025：如何利用AI不再错过任何一个opening job - M-T

SIGIR会议聚焦包容性AI与多语言技术

NeurlPS 2024! 扩散模型用于世界建模：视觉细节在Atari环境中至关重要| 计算机视觉 | 强化学习2

48（11.28）

Unclutter 黑五 Mac App 大包测评

详细介绍：VS Code 新旧版本 Remote-SSH 内网离线连接服务器方法（版本 ≤ 1.78.x 及 ≥ 1.79.0）

Python模块与包完全教程：从导入到封装发布（附实战）

29（11.3）

[豪の算法奇妙冒险] 代码随想录算法训练营第八天 | 344-反转字符串、541-反转字符串II、Carl54-替换数字

【Webpack连载一】入门简介。了解为什么需要Webpack，解决哪些开发中通病 - 实践

31（11.5）

26 10.29

深入解析：GitLab 钩子 + Jenkins 自动化构建项目

27.10.30

抖音a_bogus,mstoken全参数爬虫逆向补环境2024-06-15

深度学习50问

⭐论文简介

⭐核心贡献

⭐研究方法

⭐研究结果

相关文章：