当前位置：首页 > news >正文

超节点、灵衢、CANN，华为给出了智算时代的新选择

news 2026/6/3 3:03:05

文章配图-1
一个月前的数字中国建设峰会上，华为展台呈现出了一种极具张力的科技图景。

一边是围绕云、计算、数据通信、光网络、存储等核心能力构建的硬核产品和前沿技术，一边是AI使能政务、经济、社会、文化、生态文明等行业的数智化鲜活案例。

穿梭在两大展区间，有一个直观的感受：AI已经彻底告别“对话玩具”属性，全面嵌入到了千行万业的“生产系统”中。

由表及里的智能化跃升，绝非简单的软件升级。当AI应用深入工业制造、电网调度、航空决策等复杂场景，传统的算力堆叠模式开始暴露出明显的局限性，算力产业再次站在了十字路口。

01 Agent新范式改写了算力供求
要理解底层算力为何需要重构，必须先厘清上层应用的演变。

在第九届数字中国建设峰会上，传递出了一个不应被忽视的产业共识：2026年是Agent应用的爆发元年。

直接的例子就是“龙虾”类产品的流行。无论是OpenClaw、Hermes，还是各种套壳的“Claw”，新产品的不断涌现，标志着企业IT的开发范式正在从传统的SOP（标准作业程序）向Agent体系迁移。

在传统的企业IT架构中，业务逻辑的实现高度依赖SOP：通常需要懂业务的人员提炼出确定的业务流，再由IT技术人员转化为AI能执行的语言。在处理确定性任务时效率极高，但面对复杂、动态且充满不确定性的生产环境时，往往会显得僵化且难以实时响应。

文章配图-1

而OpenClaw代表的Agent框架，最大的特点就是具备自主执行、多轮推理和自我进化的能力，让AI可以处理不确定性的业务流和格式复杂的数据源，在行业中引发了剧烈的连锁反应。

比如对业务创新的根本性驱动。

在Agent框架下，即使是不懂底层技术的业务人员，也能用自然语言编写和调度Skills，转化为AI可以准确执行的语言，大幅降低了AI参与不确定性复杂业务的门槛，让数字员工与真实员工的协同办公成为可能。

再比如推理需求的指数级跃升。

根据中信证券的测算，智能体执行任务时整体Token消耗可能提升十倍以上，对应的算力需求得涨百倍以上。高盛追踪的数据显示，中国市场整体AI日均Token消耗已经从2024年5月的0.12万亿次，爆增至2026年3月的140万亿次，不到两年时间增长超过1000倍。

一旦Agent规模化进入生产系统，面对多轮推理和长序列的调用，Token的需求量还将发生量级跨越。

应用侧的狂飙默默改写了算力产业的账本。

过去算力资源主要向大模型的训练侧倾斜，但中国信通院等权威机构的预测数据显示，2026年推理侧算力将首次追平甚至超过训练侧算力。算力需求的结构性变化，意味着传统以大规模并行训练为核心的计算中心，必须向更具弹性、更低时延、更高吞吐的方向转型。

也就是说，Agent新范式不仅改变了我们使用AI的方式，正深刻影响整个算力底座的供求逻辑。

02 AI原生计算正重塑算力底座
因为Agent驱动的新范式，绝不限于推理算力需求的增长数字，已经像一把手术刀切入IT架构的深水区。

在传统的IT架构中，高度依赖操作系统与数据库，聚焦于CPU、硬盘和内存的协同，现在发生了“山呼海啸”的变化：2024年由人创建的数据库实例占7-8成，到了2025年，Agent建立的数据库实例占比已达7成，并呈现出了即时拉起、即时消亡的高频特征，传统的服务器形态已无法满足。

华为计算Marketing与解决方案销售部总裁常成在演讲中提出了一个判断：我们已经站在第三次计算架构变革的前夜。

如果说第一次是大机和小机的封闭时代，第二次是分布式虚拟化和云主导的时代，第三次将是AI原生的计算架构时代。怎么理解AI原生的计算架构呢？答案可以归纳为四个核心维度。

一是性能更高，全面迈入“超节点”时代。

进入2025年后，全球头部厂商均走向了“超节点”，最直接的驱动因素无疑是性能。以华为最新的超节点产品Atlas 950为例，可支持8192张昇腾卡，在卡规模、总算力、内存容量、互联带宽等关键指标上全面领先同类产品，用极高的算力密度回应了AI对极致性能的渴求。

文章配图-1

二是大通量，跨越光电物理瓶颈。

在超节点的技术路线上，业界一直存在“光电悖论”：电连接稳定性高，但传输距离极短；光连接能实现长距传输，但时延难以保证，且故障率相对较高。华为给出的答案是——光电融合，通过灵衢总线实现了大带宽且时延、长距离且高可靠的目标，“超节点”的跨柜光电传输已经成为可能。

三是高扩展，七大组件的底层协议统一。

仅仅解决物理连接还不够，逻辑层面的通信壁垒同样致命。当前业界的部分方案只解决了局部问题，比如CPU与GPU的互通，而华为自研的“灵衢”互联协议，已经实现了去中心化与多组件协议统一，可将NPU、CPU、GPU、Memory、硬盘、内存、交换机彻底打通，消除了协议转换的时延。

四是多样性算力的融合。

在Agent时代，不单单需要NPU、GPU等智能算力，还需要CPU承接海量的业务流转。AI原生计算的基础设施，将不再按“PU”区分任务类型，数据在哪里，算力就在哪里。直接的例子就是华为推出的通用计算超节点TaiShan 950 SuperPoD，在数据库、大数据等高算力场景下的性能提升显著。

做一个判断的话：AI原生算力底座的竞赛，早已从“产品能力”跃迁为“系统能力”，并将进一步演进为“生态能力”。

03 高效创新的开放算力新生态
底层算力的重塑铺就了坚实的轨道，想让AI列车在千行万业跑出加速度，还需要一个高效、开放、标准化的繁荣生态。

摆在面前的问题在于：尽管算力部署呈现出了规模化和专业化的趋势，但产业生态布局相对分散，多厂商间的异构兼容能力偏弱，导致软硬件适配碎片化、应用端在算力选型上面临高门槛，而且大规模集群扩展缺乏统一规范，严重制约了产业效率的提升。

乐观的是，行业渐渐涌现出了两条明确的破局路径。

第一个是前沿模型与基础软硬件的强耦合。

很长一段时间里，模型与算力底座的适配多为滞后的“被动适配”，周期往往长达数月。现在，模型与算力开始“双向奔赴”。

以DeepSeek V4为例，在研发阶段就与昇腾在内的国产算力进行了深度协同，结合精度量化等机制，实现了高吞吐、低时延的极速推理部署。在DeepSeek V4开源当天，多家算力企业宣布实现了Day0适配，标志着行业已经跨越被动适配的分水岭，迈入了以周甚至以天为单位的“原生敏捷适配”新阶段。

第二个是标准牵引下的集群生态网络化。

就在第九届数字中国建设峰会的计算产业峰会上，中国信息通信研究院联合产业各方发起了“1+N”CANN生态网络计划。

文章配图-1

以人工智能软硬件协同创新与适配验证中心为“1”个核心节点，汇聚区域生态创新中心、ISV合作伙伴及行业领军企业等“N”个节点，旨在通过标准化的适配验证，打通技术到应用的关键环节，解决“点对点”适配难题，加速自主智算解决方案的规模化应用与标杆案例推广，进而构建出一个开放、协同的智算产业生态网络。

在软硬协同与生态网络的推动下，产业界不断将算力转化为可落地的生产力，持续涌现出了不少标杆实践。

在航空领域，南航依托昇腾打造的国产智算底座，研发出了“天策航空求解器”。面对极端天气下的航班恢复难题，通过自主算子库和AI运筹算法，将原本数小时的决策时间压缩至约20分钟。

在能源电力领域，南方电网与华为联合研发“妙算”系列高能效服务器，提出了“算电协同”的理念：通过CPU动态调频、智能风扇温控预测及高效电源优化，实现整机功耗降低13%-15%。

隐藏在上述实践背后的，是产业界合力打造新质生产力的现在进行时，一个开放、协同、高效创新的生态渐行渐近。

04 写在最后
在Token需求爆炸、技术迭代以日计的时代，算力基础设施早已超越了单纯的IT设备，成为了产业向上的核心引擎。

正如我们所看到的：中国计算产业没有选择在旧有架构上修修补补，勇敢地踏入了AI原生计算的“深水区”。从“灵衢”总线打通七大组件的底层协议，到“1+N”CANN生态网络打破算力孤岛，再到昇腾、鲲鹏在千行万业复杂场景中的试炼与智变，为全球产业界提供了可复制、可落地的新选择，也让世界看到了另一种可能。

查看全文

http://www.jsqmd.com/news/939631/

从DDR4到PCIe 5.0：聊聊Allegro中那些容易被忽略的‘隐性’信号延迟（以Via Z轴延迟为例）

收藏！7个文理兼收的AI高薪岗位，小白也能轻松入门

【ACM稳定出版检索】2026年人工智能与智慧生活国际学术会议 (ICAISL 2026)

计算机毕业设计之基于hadoop的网易云音乐推荐系统的设计与实现

发票、合同、身份证——OCR在金融行业到底替代了多少人工

别再乱调参数了！OpenCV Canny边缘检测的threshold1和threshold2到底怎么设？附实战调参技巧

实战指南：基于快马平台开发智能程控lm317电源，实现实验室精密供电

Mixly图形化编程一键接入Blinker物联网的点灯科技扩展包（含ESP32示例与完整开发文件）

不止点灯！用FreeRTOS在GD32F407上实现多任务串口打印与按键响应

保姆级教程：用OpenIPC和WFB-NG在Jetson Orin Nano上搭建低延迟无人机图传（含RTL8812AU驱动避坑）

别再只调PID了！用Mahony算法搞定MPU6050姿态解算（附Arduino代码）

在MacBook M1/M2上用QEMU 8.2跑Windows 10 ARM版：保姆级配置与驱动安装避坑指南

别再只懂k-anonymity了：用Python实战带你搞懂隐私模型三剑客（附代码）

别再死记硬背了！保姆级图解：在银河麒麟V10服务器上配置bond双网卡（附7种模式选择指南）

RK3588 Android13广告机项目实战：手把手搞定RTL8852BS的WiFi与蓝牙双模驱动（附完整DTS配置）

告别高斯噪声！手把手教你用DiGress在离散图上玩转扩散模型（附ICLR 2023论文解读）

AI工具付费决策全图谱，从LTV/CAC比值、API调用频次到企业级审计支持——技术负责人必读的5步评估法

配置任务计划程序

OpenClaw从入门到应用——CLI：Daemon

“新增考点专项突破（分布式/微服务/AI）”通常指在技术类考试（如软考高级系统架构设计师、云原生认证、大厂技术面试、AI工程化能力评估等）

告别CheckM1的烦恼：用CheckM2快速筛选高质量宏基因组bin（附保姆级conda安装教程）

告别手动制表：用快马AI自动生成运营数据分析周报，效率提升十倍

Anaconda Navigator双击没反应？别急着重装，试试这个保姆级修复流程（附清华源配置）

ZYNQ开发避坑指南：手把手教你解决PS与DDR通信的Cache一致性问题

从FXML到EXE：手把手教你用SceneBuilder 21.0 + JDK 17打包独立JavaFX桌面应用（含资源路径避坑指南）

从传统到智能：鲁健如何用AI重构含禁手五子棋的对弈逻辑

基于网络爬虫的XSS漏洞检测系统的设计与实现

OpenClaw从入门到应用——CLI：Cron

用MATLAB Simulink给Stewart平台做个‘体检’：从建模到运动仿真全流程

三步快速解密微信聊天记录：WechatDecrypt完整使用指南

相关文章：