当前位置：首页 > news >正文

神经计算机：让AI不再是工具，而是计算机本身

news 2026/7/15 11:37:40

# 神经计算机：让AI不再是工具，而是计算机本身

## 一、引言

2026年4月7日，一篇题为《Neural Computers》的论文悄然上线arXiv，作者团队由Mingchen Zhuge等19人组成，来自Meta AI与KAUST。这篇论文提出了一个野心勃勃的概念——神经计算机（Neural Computers, NCs）。如果说当下的AI Agent（智能体）是在“使用”计算机，那么神经计算机试图做到的是：让AI“成为”那台计算机本身。

这一概念迅速引发学术界的广泛关注，有评论称其可能超越Agent和世界模型，开辟第三条技术路线。那么，神经计算机究竟是什么？它与我们熟知的计算机、AI Agent有何本质区别？本文将为你全面拆解这一前沿概念。

## 二、从“善假于物”到“自成一物”：概念演进

### 2.1 计算机的演化之路

理解神经计算机，首先要看清人与机器的关系经历了怎样的变化。

第一阶段：传统计算机。人直接操作系统，计算机执行显式编写的程序。计算、存储、输入输出各司其职，这是冯·诺依曼架构统治的时代。

第二阶段：AI Agent时代。最近几年，大模型学会了调用工具——浏览器、操作系统、API、IDE——成为横亘在人与计算机之间的“中间层”。正如知乎上一位高赞回答所概括的：“从前是人→电脑，现在越来越像人→AI智能体→计算机”。但无论Agent多么强大，它本质上仍然站在计算机系统之外，任务的实际执行状态始终保存在操作系统或应用程序中，而不在模型自身之内。

第三阶段：世界模型。以Yann LeCun等人为代表的研究者倡导世界模型，其核心关切的不是“替你完成任务”，而是“环境会如何演化”。世界模型学习的是对未来的预测，而非自身执行计算。

这三种范式有一个共同的局限：可执行状态始终存在于模型之外。正是在这个架构空白点上，神经计算机的概念被提了出来。

### 2.2 神经计算机的核心理念

神经计算机的核心理念可以凝练成一句话：将计算、内存与输入输出（I/O）统一整合到一个习得的潜空间运行时状态中，让模型本身成为那台正在运行的计算机。

通俗地理解，传统计算机的CPU负责算，内存负责存，硬盘和屏幕负责输入输出，三者通过总线来通信。而神经计算机设想用一个统一的神经网络来同时承担这三个角色——不是分别设计计算、存储和I/O模块，而是让模型通过训练，自动涌现出这些功能。

知乎作者tomsheep的比喻非常精妙：“荀子说‘君子生非异也，善假于物也’。最近几年的AI在‘善假于物’这件事上做得越来越好，而NC的立意要更高一层：不是让AI使用电脑，而是成为电脑本身。”

## 三、前世今生：神经计算机的技术谱系

### 3.1 DeepMind的DNC：早期探索

2016年10月，谷歌DeepMind团队在《自然》杂志上发表了一种名为可微分神经计算机（Differentiable Neural Computer, DNC）的学习机器，堪称神经计算机概念的前身。

DNC将神经网络与外部存储结构结合在一起：前者通过示例或反复试验进行学习，后者与传统计算机的随机存取存储器（RAM）相似。这使得机器既能像神经网络那样学习，又能像传统计算机那样处理结构化数据。

在实验中，DNC在没有现成知识的情况下，成功规划出伦敦地铁的最佳线路，或根据符号语言描述解决方块拼图问题。然而，DNC仍是一个神经网络+外部存储的混合系统，依赖显式的存储读写机制，与今天Meta提出的“模型即计算机”有着根本差异。

### 3.2 Meta NC：从“调用”到“成为”的范式跃迁

2026年的NC论文在立意上更加彻底。研究团队提出的长期目标称为完全神经计算机（Complete Neural Computer, CNC）——一种成熟的、通用的NC形态，拥有稳定执行、显式重编程及持久复用能力。

CNC必须满足四个严苛条件：

· 图灵完备：具备通用计算能力

· 通用可编程：可被显式地重新编程

· 行为一致性：相同输入产生稳定、可预期的输出

· 机器原生语义：语义从数据中习得，而非由人类显式编程

目前，团队已经构建了基于命令行界面（CLI）和图形界面（GUI）的原型系统。他们用大量真实操作轨迹训练模型，让模型学习“人在电脑上做了什么操作，屏幕通常会怎么变化”。实验结果表明，模型已经能掌握I/O对齐、短距控制等基础能力。但这些还只是概念雏形，距离真正的通用计算还有显著差距。

### 3.3 四类系统的对比

为了清晰定位NC的位置，我们用一张表来总结：

系统类型核心功能执行状态位置典型代表

传统计算机执行显式程序操作系统内 PC、服务器

AI Agent 操作外部环境被调用的应用内 AutoGPT、Claude with tools

世界模型预测环境动态不涉及执行 LeCun的JEPA架构

神经计算机模型自身就是运行时模型内部 Meta NC（原型阶段）

简而言之：传统计算机执行程序，Agent调用工具，世界模型预测未来，而神经计算机本身就成为运行的载体。

## 四、关键技术原理

### 4.1 统一运行时状态：计算、内存与I/O的一体化

NC最核心的创新在于提出了一种新的抽象：将计算、内存和I/O统一在一个习得的潜空间运行时状态中。这并非简单的模块叠加，而是从数据中习得整个执行逻辑。

具体而言，NC原型的实现方式是通过视频生成式建模：将CLI或GUI的屏幕帧作为生成目标，模型根据指令、像素信息和可用操作来预测下一帧画面。这跳过了对程序内部状态的显式追踪，让模型通过观察海量I/O轨迹来隐式地学会“什么是计算”。

传统计算机实例化的是局部的、组合的符号语义（如二进制加法、逻辑门），而神经计算机实现的是整体的、分布式的数值语义。在编程方式上，前者的语义由人类显式设计，后者的语义从数据中习得用户输入序列的含义。

### 4.2 技术路线图：通向完全神经计算机的路径

从当前原型迈向CNC，研究团队规划了一条清晰的技术路线：

· 突破上下文窗口限制：通过实现无界的有效内存来扩展NC的执行能力

· 组合式神经程序：构建可复用、可组合的程序原语，让NC学到的能力能被反复调用

· 分离“运行”与“更新”：在架构层面区分推理执行和参数更新，避免每次运行都改变模型行为

· 以交互I/O轨迹为主要训练数据：坚持让系统通过真实交互习得底层计算逻辑

### 4.3 当前局限与挑战

研究者并未回避NC面临的严峻挑战。常规复用（routine reuse）、受控更新（controlled update）与符号稳定性（symbolic stability）是当前最突出的三大难题。模型的输出尚不能稳定地处理符号和逻辑，学到的能力也还不能像函数调用一样被反复复用。

## 五、不可忽视的基础：神经形态计算硬件的并行革命

如果说Meta的NC是在软件和架构层面“让模型成为计算机”，那么神经形态计算（Neuromorphic Computing）则是在硬件层面“让芯片像大脑一样工作”。两者理念相通但层次不同，前者关注的是软件层面的运行时抽象，后者关注的是物理层面的仿生计算架构。

### 5.1 为什么要“模仿大脑”？

当前AI硬件正面临严峻挑战。据TechTarget 2026年2月的分析，美国数据中心用电已占全国总需求的约4.4%，且仍在急剧增长。单个数据中心级GPU功耗可达300-700瓦，大型训练集群需要数千个GPU并行，散热和供电成本居高不下。

相比之下，人脑以约20瓦的功耗支撑千亿级神经元和千万亿级突触的复杂动态网络，其能效远超现有任何AI系统。这种巨大的能效差距，正是神经形态计算的核心驱动力。

### 5.2 核心原理：事件驱动与存内计算

神经形态计算与传统冯·诺依曼架构的根本区别在于两点：

第一，计算与存储一体化。神经形态计算机没有单独的内存和处理单元，这些任务在芯片上每个神经元的位置一起执行，因此无需在内存和处理器之间传输数据，大幅减少了能耗并加快了处理速度。

第二，事件驱动机制。神经形态芯片采用脉冲神经网络（SNN），信息编码为离散的脉冲事件。没有脉冲输入时，神经元不更新、不消耗能量。这与GPU/TPU“时钟一直在跑、无效计算一直在做”的模式形成鲜明对比。法国电子与信息技术实验室（Leti）的研究团队通过硅验证的神经形态系统在图像分类任务上，较传统方案实现了能耗降低99.5%、推理时间减少76.7%的惊人效果【30†L25-L32】。

### 5.3 值得关注的硬件突破

剑桥大学氧化铪忆阻器（2026年3月）：一种受大脑启发的纳米电子元件，有望将AI系统的能耗降低高达70%。该忆阻器的切换电流仅约10纳安培，比传统氧化物装置低约一百万倍，能产生数百个稳定的电导位阶用于模拟“内存内计算”。

可编程超导神经元（2026年4月）：基于约瑟夫森结的超导神经元，工作频率高达45 GHz，每次脉冲能耗仅飞焦（fJ）级别，同时支持10个体阈值和20个突触状态，将计算、内存和可塑性融合于单一超导单元。

单晶体管模拟神经突触（2025年3月发表，2026年5月重发新闻稿）：新加坡国立大学团队在《Nature》发表成果，证明单个标准硅晶体管以特定方式运行时，可以同时模拟生物神经元和突触的行为，为大规模神经形态芯片提供了极具可扩展性的方案。

光子神经网络（2026年2-5月）：意大利CNR团队发现光子在光学电路中可自发表现为霍普菲尔德网络，用光子作为“记忆神经元”；新加坡国立大学团队则开发出光敏存储器开关，首次在光学域内实现了完全的可重构非线性激活，解决了光子神经网络长期缺失的关键一环。

极端环境忆阻器（2026年5月）：南京邮电大学等团队开发出能在50°C到300°C极端温度下稳定工作的有机异质结忆阻器，在300°C高温下仍能以93.22%准确率完成Fashion-MNIST分类任务。

### 5.4 市场前景：千亿赛道的加速

市场数据印证了这一赛道的热度。据GII市场报告，神经形态硬件市场从2025年的45.8亿美元增长至2026年的55.9亿美元，年复合增长率达22.0%，预计2030年将达122.6亿美元。神经形态计算市场从2025年的18.1亿美元增长至2026年的22.3亿美元，年增长率为23.3%。更广泛的神经技术市场（含脑机接口等）2026年预计约198.4亿美元。

## 六、神经计算机 vs 神经形态计算：一张表格说清区别

经过以上梳理，我们可以清晰区分两个极易混淆的概念：

维度神经计算机 (NC) 神经形态计算 (Neuromorphic Computing)

定位软件/架构层面的新范式硬件/芯片层面的新架构

核心思想模型即运行时，统一计算+内存+I/O 仿脑芯片，事件驱动+存内计算

解决的问题模型与计算环境的分离冯·诺依曼瓶颈与功耗墙

代表工作 Meta NC (2026) Intel Loihi、IBM TrueNorth、中科院达尔文猴

成熟度学术原型阶段已有商用芯片，生态仍在建设

关系理念相通，NC未来可运行于神经形态硬件之上 ——

## 七、未来展望与结语

神经计算机代表了一种范式革命——当我们的AI系统不再只是调用外部工具，而是本身成为可运行的计算机，会带来怎样的可能性？

短期内，NC能带来的直接价值在于打破模型与计算环境之间的壁垒。当前的AI Agent需要依赖操作系统、浏览器、API来执行任务，模型本身并不承载可执行状态，一切进展都由外部软件维护。一旦NC技术成熟，模型将能够端到端地完成从感知到执行的完整闭环，而不必经过层层“翻译”和外挂。这可能在自动化运维、软件测试、智能终端等场景率先落地。

从更长期的视角看，完全神经计算机（CNC）如果实现图灵完备、通用可编程和行为一致性，它将构建出一个超越现有Agent、世界模型和传统计算机的全新计算范式。届时，“编程”可能不再意味着用Python或C++写代码，而是通过交互和示例来“教会”一台神经计算机你想要什么。

当然，这条路还很长。当前NC原型只是一个学术概念验证，从掌握I/O对齐到实现通用可编程，中间还有大量的工程和理论难题需要攻克。但方向已经指明：计算、内存、I/O，三者终将被统一在一组神经网络权重之中。

正如论文作者所说，神经计算机的开发动机并非来自外部取代现有架构，而是通过将分散功能内化于单一学习机器中实现统一。在下一次技术浪潮来临之前，值得每一位开发者对这条路线保持关注。

查看全文

http://www.jsqmd.com/news/854535/