当前位置：首页 > news >正文

From AGI to ASI：DeepMind 万字推演超级智能的四条路、六堵墙、一个真相

news 2026/6/15 7:28:13

DeepMind 的 Shane Legg 和 Marcus Hutter 合写了一篇论文，标题直接得让人不适——《From AGI to ASI》。从通用人工智能到人工超级智能。不是"如果"，是"怎么"。

Legg 是 DeepMind 联合创始人，2007 年和 Hutter 一起提出了机器智能的形式化定义。Hutter 是 AIXI 的创始人，那个在理论上不可计算但定义了"智能极限"的数学框架。这两个人凑在一起写"从 AGI 到 ASI"，不是科幻作家在头脑风暴，而是通用智能理论的奠基人在画地图。

论文的核心论点可以压缩成一句话：AGI 不是终点，而是起点。人类级智能的引入不会是一次性变革，而是一系列变革的开端。真正需要准备的，不是某个"奇点时刻"，而是持续数十年的加速与摩擦的博弈。

一、ASI 不是"更聪明的 ChatGPT"，是"比一万个专家加起来还强"

论文对 AGI 和 ASI 的定义很精确：

AGI：约等于中位数人类的通用智能。不是爱因斯坦，是"一个能完成大多数日常认知任务的普通人"。
ASI：在几乎所有人类感兴趣的领域和任务上，远超数万名协调良好的专家级人类团队在 10 年内、使用 2010 年技术水平能达成的成就。

注意这个定义里埋了几个狠词：

“数万名专家”——不是"比一个人强"，是比一个大型组织的集体智慧强。
“10 年”——不是"更快地做完同样的事"，是"做完人类需要十年才能做完的事"。
“2010 年技术”——假设这些专家没有 AI 辅助，用传统工具工作。

ASI 的存在形式也很关键：论文认为它不是单一实体，可能是数百万实例的集体系统。这和好莱坞电影里的"一个超级 AI 大脑"完全不同——更像是一个由无数智能体组成的生态系统，各自专业化，通过协调形成超越任何个体的集体能力。

二、四条路径：Scaling、范式转移、递归改进、多智能体

论文用相当大的篇幅讨论了从 AGI 到 ASI 的四条路径，而且明确指出它们不是互斥的——可能同时发生，互相加速。

路径一：规模化（Scaling）

最直接的路线：继续过去十年的指数增长。更大模型、更多数据、更多算力、更多实例、更快运行。

论文给出的一个核心估算：有效算力每年增长约 10 倍。硬件性价比 1.5× × 投资增长 2.5× × 算法效率 3× = 10×/年。如果这个趋势持续，5 年后就是 10 万倍的算力。

关键问题："纯粹"数量扩展是否足够？某些问题（如 NP-hard 问题）可能需要质变突破，而不仅仅是量变。论文没有给出确定答案，只是指出这是一个当前的开放研究问题。

路径二：算法范式转移（Paradigm Shifts）

区别于"演化"（当前范式的增量改进），范式转移是剧烈偏离现有架构的根本性创新。论文列举了一些可能的演化方向：测试时动态计算、持续学习、无限工作记忆、线性时间架构（如 Mamba）。但真正的范式转移——论文坦诚地承认——本质不可预测。

"真正的范式转变的定义就是无法从当前框架预见。"这是论文里非常诚实的一句话。它没有假装知道下一个重大突破是什么。

路径三：递归自我改进（Recursive Improvement）

这是 AGI→ASI 讨论中最激进的路径。AI 加速 AI 研发→产生更强 AI→进一步加速研发，正反馈循环。论文区分了四种"风味"：

基因型：代码/架构/硬件的自我修改
文化型：数据驱动的改进（合成数据、自动数据集策划、搜索蒸馏）
社会型：专业化分工提升集体效率
硬件型：AI 设计更优芯片和制造工艺

增长动力学可能从指数增长→超指数（双曲线）增长→理论上有限时间内无限增长（奇点）。但论文也指出关键不确定性：递归改进是快速"熄灭"还是持续加速？资源需求是否指数爆炸？涉及物理操作的改进（芯片制造）无法任意加速——你不可能让晶圆厂以 1000 倍速度运行。

路径四：多智能体集体（Multi-Agent Collectives）

大量 AGI 智能体通过协调/自组织形成复杂适应系统，集体涌现超级智能。论文提出了三种组织形式：

设计型：完全自动化的公司/机构（“Group Agents”）
市场型：虚拟智能体经济，通过价格信号协调
自组织型：进化压力和市场动态驱动的分布式结构

这个路径的核心洞察是：绕过单一架构的瓶颈。一个智能体的上下文窗口有限，但 1000 个智能体各自专长不同领域，通过协调形成的集体能力可能远超任何个体。这和人类社会的分工逻辑一致——但数字智能的分工速度和带宽是人类社会的数量级倍数。

三、数字智能的六大"降维打击"优势

论文用 Table 1 系统列出了数字智能相比生物智能的六大优势，所有优势都随算力增加而放大：

优势	含义	人类对比
输入/输出速度	秒级摄入多本书籍	生物感官和运动神经速度受限
内部处理速度	更多算力 = 更快计算或更多并行	神经元毫秒级，进化无法快速改变
工作记忆容量	可记忆互联网大部分内容	人类工作记忆约 4-7 个组块
基质独立性	可在不同计算机间迁移、分布式运行	绑定于特定生物身体
无损复制	复制源码+记忆状态，任意备份/暂停/恢复	繁殖和知识传递高度有损
学习经验的高带宽共享	同构实例间共享原始学习信号（如平均梯度）	通过语言等"低带宽瓶颈"压缩知识

这六个优势合起来意味着什么？论文没有明说，但 implication 很清楚：如果数字智能在速度、记忆、复制、协作上都比人类强几个数量级，那么它的文化进化速度可能是人类社会的指数倍。人类花了几千年才建立的科学体系，数字智能可能在几十年内重建并超越。

但论文也引用了 N. Lawrence 的"具身因子"论点作为 counterpoint：高 I/O 带宽可能削弱形成深层抽象和内部世界模型的必要性。如果可以直接查询所有信息，可能不需要像人类那样通过压缩经验来形成直觉。

四、六堵高墙：数据、算力、物理、抽象、对齐、复杂性

论文在讨论完路径后，笔锋一转，列出了六大瓶颈（Table 4）。这些不是"能不能到 ASI"的问题，而是"到 ASI 的过程中会慢多少"的问题。

1. 数据瓶颈

高质量人类文本数据预计本世纪末耗尽。AGI 级模型可能通过高保真模拟和合成数据克服，但合成数据质量能否突破仍是开放问题。如果 AGI 自己生成的数据质量不够高，scaling 路径会率先撞到墙。

2. 计算资源限制

能源、硬件制造、自然资源的经济和物理约束。论文没有具体计算，但指出如果有效算力继续 10×/年增长，能源需求会快速接近全球电力供应的显著比例。这不是"不可能"，是"需要准备"——需要更高效的硬件、更多的能源基础设施、更优的算法效率。

3. 算法效率收益递减

保持指数研究进步需要指数经济投入（Bloom et al., 2020）。这是经济学层面的瓶颈——不是技术上不能，而是经济上可能无法持续无限投入。

4. 物理世界交互瓶颈

物理实验无法任意加速。制造、能源生产、材料科学受物理定律约束。即使纯数字研究者可以加速，涉及物理操作的改进需要等待真实世界的反馈。这主要限制递归改进（硬件改进）和多智能体（物理部署）的路径。

5. 抽象障碍（Abstraction Barrier）

AI 可能形成与人类根本不同的抽象，导致沟通、对齐、合作困难。想象一个数学家的思维方式和一个音乐家的思维方式——现在把这个差异放大 1000 倍。ASI 的抽象可能对人类完全陌生，这将严重阻碍人机协作和多智能体协调。

6. 对齐与控制挑战

确保 ASI 目标与价值观与人类兼容。这是跨所有路径的根本性挑战。递归改进可能放大初始对齐失败——如果第一代 AGI 的价值观有微小偏差，第二代可能把这个偏差放大到不可收拾。

五、渐进式革命，不是奇点爆炸

论文最重要的一个论点，可能也是最容易被忽视的一个：

“More apt might be the prospect of a series of transformative societal changes caused by AI-enabled progress and breakthroughs across many areas of science and technology.”

ASI 不是"一夜之间天翻地覆"的奇点事件。它更像工业革命、信息革命——持续数十年的多波变革。每次 AI 能力提升都引发社会调整，调整过程本身成为下一波进步的背景。

这个论点的预测含义是：需要"大规模跨学科、全球范围的努力"来准备，而不是针对单一"奇点时刻"做预案。这是一个更务实但也更复杂的应对策略——因为"渐进式"意味着变革不是一次性发生的，而是持续渗透到社会的每个毛细血管。

六、理论锚点：AIXI 作为"不可触及的上限"

论文在开头和结尾反复引用 Marcus Hutter 的 AIXI 框架。AIXI 是机器智能的理论极限，在所有可计算环境中最大化期望累积奖励。但它不可计算——只能由越来越强大的 ASI 从下方逼近。

Hutter 的观点（论文第 8 节引述）是：AIXI 是"我们当前对机器智能极限的最佳理解"。即使它不可计算，其理论性质为理解"智能能走多远"提供了一个锚点。就像热力学定律为内燃机工程提供了理论边界，AIXI 为 AI 发展提供了理论边界。

Hutter 在 2012 年的《Universal Artificial Intelligence》中描绘了一个愿景：数字智能 inhabiting 纯计算虚拟世界，物理世界仅用于获取算力资源。论文提到这个愿景时，没有评价它是否现实，只是把它作为一个可能的未来路径列出来。

七、为什么这篇论文重要

它来自理论奠基人：不是智库的政策报告，不是科技公司的公关稿，而是通用智能理论的创始人（Legg + Hutter）在学术框架内的严肃推演。
它诚实地承认不确定性：论文没有给出"AGI 将在 2027 年到来"或"ASI 将在 2035 年到来"这样的预测。它反复使用"开放问题"“不确定”"不可预测"这样的词。在一个充满炒作的领域，这种诚实本身就是稀缺品。
它把讨论从"会不会"转到"怎么准备"：无论四条路径的哪条更可能，无论六大瓶颈的影响是大是小，论文的结论都是需要准备——“大规模跨学科、全球范围的努力”。
它打破了"单步跳跃"的迷思：AGI 不是终点，是起点。这个框架比"奇点论"更复杂，但也更现实。