当前位置: 首页 > news >正文

神经计算机:让AI不再是工具,而是计算机本身

# 神经计算机:让AI不再是工具,而是计算机本身

## 一、引言

2026年4月7日,一篇题为《Neural Computers》的论文悄然上线arXiv,作者团队由Mingchen Zhuge等19人组成,来自Meta AI与KAUST。这篇论文提出了一个野心勃勃的概念——神经计算机(Neural Computers, NCs)。如果说当下的AI Agent(智能体)是在“使用”计算机,那么神经计算机试图做到的是:让AI“成为”那台计算机本身。

这一概念迅速引发学术界的广泛关注,有评论称其可能超越Agent和世界模型,开辟第三条技术路线。那么,神经计算机究竟是什么?它与我们熟知的计算机、AI Agent有何本质区别?本文将为你全面拆解这一前沿概念。

## 二、从“善假于物”到“自成一物”:概念演进

### 2.1 计算机的演化之路

理解神经计算机,首先要看清人与机器的关系经历了怎样的变化。

第一阶段:传统计算机。 人直接操作系统,计算机执行显式编写的程序。计算、存储、输入输出各司其职,这是冯·诺依曼架构统治的时代。

第二阶段:AI Agent时代。 最近几年,大模型学会了调用工具——浏览器、操作系统、API、IDE——成为横亘在人与计算机之间的“中间层”。正如知乎上一位高赞回答所概括的:“从前是人→电脑,现在越来越像人→AI智能体→计算机”。但无论Agent多么强大,它本质上仍然站在计算机系统之外,任务的实际执行状态始终保存在操作系统或应用程序中,而不在模型自身之内。

第三阶段:世界模型。 以Yann LeCun等人为代表的研究者倡导世界模型,其核心关切的不是“替你完成任务”,而是“环境会如何演化”。世界模型学习的是对未来的预测,而非自身执行计算。

这三种范式有一个共同的局限:可执行状态始终存在于模型之外。正是在这个架构空白点上,神经计算机的概念被提了出来。

### 2.2 神经计算机的核心理念

神经计算机的核心理念可以凝练成一句话:将计算、内存与输入输出(I/O)统一整合到一个习得的潜空间运行时状态中,让模型本身成为那台正在运行的计算机。

通俗地理解,传统计算机的CPU负责算,内存负责存,硬盘和屏幕负责输入输出,三者通过总线来通信。而神经计算机设想用一个统一的神经网络来同时承担这三个角色——不是分别设计计算、存储和I/O模块,而是让模型通过训练,自动涌现出这些功能。

知乎作者tomsheep的比喻非常精妙:“荀子说‘君子生非异也,善假于物也’。最近几年的AI在‘善假于物’这件事上做得越来越好,而NC的立意要更高一层:不是让AI使用电脑,而是成为电脑本身。”

## 三、前世今生:神经计算机的技术谱系

### 3.1 DeepMind的DNC:早期探索

2016年10月,谷歌DeepMind团队在《自然》杂志上发表了一种名为可微分神经计算机(Differentiable Neural Computer, DNC)的学习机器,堪称神经计算机概念的前身。

DNC将神经网络与外部存储结构结合在一起:前者通过示例或反复试验进行学习,后者与传统计算机的随机存取存储器(RAM)相似。这使得机器既能像神经网络那样学习,又能像传统计算机那样处理结构化数据。

在实验中,DNC在没有现成知识的情况下,成功规划出伦敦地铁的最佳线路,或根据符号语言描述解决方块拼图问题。然而,DNC仍是一个神经网络+外部存储的混合系统,依赖显式的存储读写机制,与今天Meta提出的“模型即计算机”有着根本差异。

### 3.2 Meta NC:从“调用”到“成为”的范式跃迁

2026年的NC论文在立意上更加彻底。研究团队提出的长期目标称为完全神经计算机(Complete Neural Computer, CNC)——一种成熟的、通用的NC形态,拥有稳定执行、显式重编程及持久复用能力。

CNC必须满足四个严苛条件:

· 图灵完备:具备通用计算能力

· 通用可编程:可被显式地重新编程

· 行为一致性:相同输入产生稳定、可预期的输出

· 机器原生语义:语义从数据中习得,而非由人类显式编程

目前,团队已经构建了基于命令行界面(CLI)和图形界面(GUI)的原型系统。他们用大量真实操作轨迹训练模型,让模型学习“人在电脑上做了什么操作,屏幕通常会怎么变化”。实验结果表明,模型已经能掌握I/O对齐、短距控制等基础能力。但这些还只是概念雏形,距离真正的通用计算还有显著差距。

### 3.3 四类系统的对比

为了清晰定位NC的位置,我们用一张表来总结:

系统类型 核心功能 执行状态位置 典型代表

传统计算机 执行显式程序 操作系统内 PC、服务器

AI Agent 操作外部环境 被调用的应用内 AutoGPT、Claude with tools

世界模型 预测环境动态 不涉及执行 LeCun的JEPA架构

神经计算机 模型自身就是运行时 模型内部 Meta NC(原型阶段)

简而言之:传统计算机执行程序,Agent调用工具,世界模型预测未来,而神经计算机本身就成为运行的载体。

## 四、关键技术原理

### 4.1 统一运行时状态:计算、内存与I/O的一体化

NC最核心的创新在于提出了一种新的抽象:将计算、内存和I/O统一在一个习得的潜空间运行时状态中。这并非简单的模块叠加,而是从数据中习得整个执行逻辑。

具体而言,NC原型的实现方式是通过视频生成式建模:将CLI或GUI的屏幕帧作为生成目标,模型根据指令、像素信息和可用操作来预测下一帧画面。这跳过了对程序内部状态的显式追踪,让模型通过观察海量I/O轨迹来隐式地学会“什么是计算”。

传统计算机实例化的是局部的、组合的符号语义(如二进制加法、逻辑门),而神经计算机实现的是整体的、分布式的数值语义。在编程方式上,前者的语义由人类显式设计,后者的语义从数据中习得用户输入序列的含义。

### 4.2 技术路线图:通向完全神经计算机的路径

从当前原型迈向CNC,研究团队规划了一条清晰的技术路线:

· 突破上下文窗口限制:通过实现无界的有效内存来扩展NC的执行能力

· 组合式神经程序:构建可复用、可组合的程序原语,让NC学到的能力能被反复调用

· 分离“运行”与“更新”:在架构层面区分推理执行和参数更新,避免每次运行都改变模型行为

· 以交互I/O轨迹为主要训练数据:坚持让系统通过真实交互习得底层计算逻辑

### 4.3 当前局限与挑战

研究者并未回避NC面临的严峻挑战。常规复用(routine reuse)、受控更新(controlled update)与符号稳定性(symbolic stability)是当前最突出的三大难题。模型的输出尚不能稳定地处理符号和逻辑,学到的能力也还不能像函数调用一样被反复复用。

## 五、不可忽视的基础:神经形态计算硬件的并行革命

如果说Meta的NC是在软件和架构层面“让模型成为计算机”,那么神经形态计算(Neuromorphic Computing)则是在硬件层面“让芯片像大脑一样工作”。两者理念相通但层次不同,前者关注的是软件层面的运行时抽象,后者关注的是物理层面的仿生计算架构。

### 5.1 为什么要“模仿大脑”?

当前AI硬件正面临严峻挑战。据TechTarget 2026年2月的分析,美国数据中心用电已占全国总需求的约4.4%,且仍在急剧增长。单个数据中心级GPU功耗可达300-700瓦,大型训练集群需要数千个GPU并行,散热和供电成本居高不下。

相比之下,人脑以约20瓦的功耗支撑千亿级神经元和千万亿级突触的复杂动态网络,其能效远超现有任何AI系统。这种巨大的能效差距,正是神经形态计算的核心驱动力。

### 5.2 核心原理:事件驱动与存内计算

神经形态计算与传统冯·诺依曼架构的根本区别在于两点:

第一,计算与存储一体化。 神经形态计算机没有单独的内存和处理单元,这些任务在芯片上每个神经元的位置一起执行,因此无需在内存和处理器之间传输数据,大幅减少了能耗并加快了处理速度。

第二,事件驱动机制。 神经形态芯片采用脉冲神经网络(SNN),信息编码为离散的脉冲事件。没有脉冲输入时,神经元不更新、不消耗能量。这与GPU/TPU“时钟一直在跑、无效计算一直在做”的模式形成鲜明对比。法国电子与信息技术实验室(Leti)的研究团队通过硅验证的神经形态系统在图像分类任务上,较传统方案实现了能耗降低99.5%、推理时间减少76.7%的惊人效果【30†L25-L32】。

### 5.3 值得关注的硬件突破

剑桥大学氧化铪忆阻器(2026年3月): 一种受大脑启发的纳米电子元件,有望将AI系统的能耗降低高达70%。该忆阻器的切换电流仅约10纳安培,比传统氧化物装置低约一百万倍,能产生数百个稳定的电导位阶用于模拟“内存内计算”。

可编程超导神经元(2026年4月): 基于约瑟夫森结的超导神经元,工作频率高达45 GHz,每次脉冲能耗仅飞焦(fJ)级别,同时支持10个体阈值和20个突触状态,将计算、内存和可塑性融合于单一超导单元。

单晶体管模拟神经突触(2025年3月发表,2026年5月重发新闻稿): 新加坡国立大学团队在《Nature》发表成果,证明单个标准硅晶体管以特定方式运行时,可以同时模拟生物神经元和突触的行为,为大规模神经形态芯片提供了极具可扩展性的方案。

光子神经网络(2026年2-5月): 意大利CNR团队发现光子在光学电路中可自发表现为霍普菲尔德网络,用光子作为“记忆神经元”;新加坡国立大学团队则开发出光敏存储器开关,首次在光学域内实现了完全的可重构非线性激活,解决了光子神经网络长期缺失的关键一环。

极端环境忆阻器(2026年5月): 南京邮电大学等团队开发出能在50°C到300°C极端温度下稳定工作的有机异质结忆阻器,在300°C高温下仍能以93.22%准确率完成Fashion-MNIST分类任务。

### 5.4 市场前景:千亿赛道的加速

市场数据印证了这一赛道的热度。据GII市场报告,神经形态硬件市场从2025年的45.8亿美元增长至2026年的55.9亿美元,年复合增长率达22.0%,预计2030年将达122.6亿美元。神经形态计算市场从2025年的18.1亿美元增长至2026年的22.3亿美元,年增长率为23.3%。更广泛的神经技术市场(含脑机接口等)2026年预计约198.4亿美元。

## 六、神经计算机 vs 神经形态计算:一张表格说清区别

经过以上梳理,我们可以清晰区分两个极易混淆的概念:

维度 神经计算机 (NC) 神经形态计算 (Neuromorphic Computing)

定位 软件/架构层面的新范式 硬件/芯片层面的新架构

核心思想 模型即运行时,统一计算+内存+I/O 仿脑芯片,事件驱动+存内计算

解决的问题 模型与计算环境的分离 冯·诺依曼瓶颈与功耗墙

代表工作 Meta NC (2026) Intel Loihi、IBM TrueNorth、中科院达尔文猴

成熟度 学术原型阶段 已有商用芯片,生态仍在建设

关系 理念相通,NC未来可运行于神经形态硬件之上 ——

## 七、未来展望与结语

神经计算机代表了一种范式革命——当我们的AI系统不再只是调用外部工具,而是本身成为可运行的计算机,会带来怎样的可能性?

短期内,NC能带来的直接价值在于打破模型与计算环境之间的壁垒。当前的AI Agent需要依赖操作系统、浏览器、API来执行任务,模型本身并不承载可执行状态,一切进展都由外部软件维护。一旦NC技术成熟,模型将能够端到端地完成从感知到执行的完整闭环,而不必经过层层“翻译”和外挂。这可能在自动化运维、软件测试、智能终端等场景率先落地。

从更长期的视角看,完全神经计算机(CNC)如果实现图灵完备、通用可编程和行为一致性,它将构建出一个超越现有Agent、世界模型和传统计算机的全新计算范式。届时,“编程”可能不再意味着用Python或C++写代码,而是通过交互和示例来“教会”一台神经计算机你想要什么。

当然,这条路还很长。当前NC原型只是一个学术概念验证,从掌握I/O对齐到实现通用可编程,中间还有大量的工程和理论难题需要攻克。但方向已经指明:计算、内存、I/O,三者终将被统一在一组神经网络权重之中。

正如论文作者所说,神经计算机的开发动机并非来自外部取代现有架构,而是通过将分散功能内化于单一学习机器中实现统一。在下一次技术浪潮来临之前,值得每一位开发者对这条路线保持关注。

http://www.jsqmd.com/news/854535/

相关文章:

  • learn claude code s01
  • 从DBSCAN到多帧联合聚类:手把手教你优化4D毫米波雷达点云处理流程(附避坑思路)
  • VR消防安全体验屋|沉浸式科技助力消防安全科普
  • 手把手教你用C#搞定海康机器人扫码枪的TCP通信(附完整Socket代码)
  • 别再死记硬背GitFlow命令了!用SourceTree图形化工具5分钟搞定团队协作流程
  • 2026年外墙益胶泥厂家哪家好:主流企业选型参考与实力深度分析 - 产业观察网
  • 告别哑巴设备:用DY-SV17F语音模块给你的Arduino项目加上声音(附STM32串口控制代码)
  • W5500 TCP客户端开发避坑指南:从寄存器配置到稳定通信的5个关键步骤
  • 手语数字人技术详解:3D 动画生成、动作自然度优化与实时渲染工程实践
  • MAVLink报文格式深度解析
  • AGI落地第一步:在宝马工厂里‘打工’的Figure 01,离替代产线工人还有多远?
  • 面向科研 Agent 的 Harness 实验条件固定与复现
  • 别再复制官方文档了!用Python把文心一言API集成到你的本地应用(附完整代码)
  • 书匠策AI降重降AIGC实测|官网www.shujiangce.com |微信公众号搜一搜 书匠策AI
  • SkiP:让模仿学习学会“快进“——动作重标记如何在不改架构的情况下削减机器人 15-40% 的执行步数
  • IEEE GRSL投稿全流程避坑指南:从Latex模板到校样缴费,新手必看的7个关键节点
  • RK3588开发板量产前必做:深度解析ArmSoM-W3的DDR压力测试方案与工具选型
  • 观察不同模型在网站内容生成任务上的延迟与成本差异
  • LAV Filters终极指南:深度解析开源DirectShow解码器的架构原理与实战配置
  • 告别混乱!手把手教你用Python脚本整理RAF-DB人脸表情数据集(附Jupyter Notebook代码)
  • 国产芯赋能低功耗人体感应小夜灯方案(YL4056H 充电管理)
  • 把Milvus向量检索封装成一个Python工具类,让你的AI项目代码更整洁
  • 保姆级教程:用Python+OpenCV玩转英特尔D435i深度相机的点云与彩色对齐
  • 手把手从零搭建 Kali Linux 虚拟机,完整安装 + 汉化 + 网络配置全攻略
  • 如何用TransNet V2实现智能视频镜头检测:从零开始完整指南
  • 现货TJA1101AHN/0Z是NXP推出的一款高性能、低功耗的汽车以太网PHY芯片,作为TJA1101A的改进版本,专为车载电子系统设计,支持100BASE-T1标准,具备出色的可靠性与集成度
  • 优惠电影票API接口,7折电影起步
  • 别再只用BackgroundImage了!C# WinForm窗体背景图5种方法全解析(含PictureBox与资源文件实战)
  • USB 充电人体感应橱柜灯|国产 YL4056H 加持,安全长续航,家用照明真香
  • 强强联合,共绘未来 | 葛兰创智与中建东北院签署战略合作协议