当前位置: 首页 > news >正文

超节点、灵衢、CANN,华为给出了智算时代的新选择

文章配图-1
一个月前的数字中国建设峰会上,华为展台呈现出了一种极具张力的科技图景。

一边是围绕云、计算、数据通信、光网络、存储等核心能力构建的硬核产品和前沿技术,一边是AI使能政务、经济、社会、文化、生态文明等行业的数智化鲜活案例。

穿梭在两大展区间,有一个直观的感受:AI已经彻底告别“对话玩具”属性,全面嵌入到了千行万业的“生产系统”中。

由表及里的智能化跃升,绝非简单的软件升级。当AI应用深入工业制造、电网调度、航空决策等复杂场景,传统的算力堆叠模式开始暴露出明显的局限性,算力产业再次站在了十字路口。

01 Agent新范式改写了算力供求
要理解底层算力为何需要重构,必须先厘清上层应用的演变。

在第九届数字中国建设峰会上,传递出了一个不应被忽视的产业共识:2026年是Agent应用的爆发元年。

直接的例子就是“龙虾”类产品的流行。无论是OpenClaw、Hermes,还是各种套壳的“Claw”,新产品的不断涌现,标志着企业IT的开发范式正在从传统的SOP(标准作业程序)向Agent体系迁移。

在传统的企业IT架构中,业务逻辑的实现高度依赖SOP:通常需要懂业务的人员提炼出确定的业务流,再由IT技术人员转化为AI能执行的语言。在处理确定性任务时效率极高,但面对复杂、动态且充满不确定性的生产环境时,往往会显得僵化且难以实时响应。

文章配图-1

而OpenClaw代表的Agent框架,最大的特点就是具备自主执行、多轮推理和自我进化的能力,让AI可以处理不确定性的业务流和格式复杂的数据源,在行业中引发了剧烈的连锁反应。

比如对业务创新的根本性驱动。

在Agent框架下,即使是不懂底层技术的业务人员,也能用自然语言编写和调度Skills,转化为AI可以准确执行的语言,大幅降低了AI参与不确定性复杂业务的门槛,让数字员工与真实员工的协同办公成为可能。

再比如推理需求的指数级跃升。

根据中信证券的测算,智能体执行任务时整体Token消耗可能提升十倍以上,对应的算力需求得涨百倍以上。高盛追踪的数据显示,中国市场整体AI日均Token消耗已经从2024年5月的0.12万亿次,爆增至2026年3月的140万亿次,不到两年时间增长超过1000倍。

一旦Agent规模化进入生产系统,面对多轮推理和长序列的调用,Token的需求量还将发生量级跨越。

应用侧的狂飙默默改写了算力产业的账本。

过去算力资源主要向大模型的训练侧倾斜,但中国信通院等权威机构的预测数据显示,2026年推理侧算力将首次追平甚至超过训练侧算力。算力需求的结构性变化,意味着传统以大规模并行训练为核心的计算中心,必须向更具弹性、更低时延、更高吞吐的方向转型。

也就是说,Agent新范式不仅改变了我们使用AI的方式,正深刻影响整个算力底座的供求逻辑。

02 AI原生计算正重塑算力底座
因为Agent驱动的新范式,绝不限于推理算力需求的增长数字,已经像一把手术刀切入IT架构的深水区。

在传统的IT架构中,高度依赖操作系统与数据库,聚焦于CPU、硬盘和内存的协同,现在发生了“山呼海啸”的变化:2024年由人创建的数据库实例占7-8成,到了2025年,Agent建立的数据库实例占比已达7成,并呈现出了即时拉起、即时消亡的高频特征,传统的服务器形态已无法满足。

华为计算Marketing与解决方案销售部总裁常成在演讲中提出了一个判断:我们已经站在第三次计算架构变革的前夜。

如果说第一次是大机和小机的封闭时代,第二次是分布式虚拟化和云主导的时代,第三次将是AI原生的计算架构时代。怎么理解AI原生的计算架构呢?答案可以归纳为四个核心维度。

一是性能更高,全面迈入“超节点”时代。

进入2025年后,全球头部厂商均走向了“超节点”,最直接的驱动因素无疑是性能。以华为最新的超节点产品Atlas 950为例,可支持8192张昇腾卡,在卡规模、总算力、内存容量、互联带宽等关键指标上全面领先同类产品,用极高的算力密度回应了AI对极致性能的渴求。

文章配图-1

二是大通量,跨越光电物理瓶颈。

在超节点的技术路线上,业界一直存在“光电悖论”:电连接稳定性高,但传输距离极短;光连接能实现长距传输,但时延难以保证,且故障率相对较高。华为给出的答案是——光电融合,通过灵衢总线实现了大带宽且时延、长距离且高可靠的目标,“超节点”的跨柜光电传输已经成为可能。

三是高扩展,七大组件的底层协议统一。

仅仅解决物理连接还不够,逻辑层面的通信壁垒同样致命。当前业界的部分方案只解决了局部问题,比如CPU与GPU的互通,而华为自研的“灵衢”互联协议,已经实现了去中心化与多组件协议统一,可将NPU、CPU、GPU、Memory、硬盘、内存、交换机彻底打通,消除了协议转换的时延。

四是多样性算力的融合。

在Agent时代,不单单需要NPU、GPU等智能算力,还需要CPU承接海量的业务流转。AI原生计算的基础设施,将不再按“PU”区分任务类型,数据在哪里,算力就在哪里。直接的例子就是华为推出的通用计算超节点TaiShan 950 SuperPoD,在数据库、大数据等高算力场景下的性能提升显著。

做一个判断的话:AI原生算力底座的竞赛,早已从“产品能力”跃迁为“系统能力”,并将进一步演进为“生态能力”。

03 高效创新的开放算力新生态
底层算力的重塑铺就了坚实的轨道,想让AI列车在千行万业跑出加速度,还需要一个高效、开放、标准化的繁荣生态。

摆在面前的问题在于:尽管算力部署呈现出了规模化和专业化的趋势,但产业生态布局相对分散,多厂商间的异构兼容能力偏弱,导致软硬件适配碎片化、应用端在算力选型上面临高门槛,而且大规模集群扩展缺乏统一规范,严重制约了产业效率的提升。

乐观的是,行业渐渐涌现出了两条明确的破局路径。

第一个是前沿模型与基础软硬件的强耦合。

很长一段时间里,模型与算力底座的适配多为滞后的“被动适配”,周期往往长达数月。现在,模型与算力开始“双向奔赴”。

以DeepSeek V4为例,在研发阶段就与昇腾在内的国产算力进行了深度协同,结合精度量化等机制,实现了高吞吐、低时延的极速推理部署。在DeepSeek V4开源当天,多家算力企业宣布实现了Day0适配,标志着行业已经跨越被动适配的分水岭,迈入了以周甚至以天为单位的“原生敏捷适配”新阶段。

第二个是标准牵引下的集群生态网络化。

就在第九届数字中国建设峰会的计算产业峰会上,中国信息通信研究院联合产业各方发起了“1+N”CANN生态网络计划。

文章配图-1

以人工智能软硬件协同创新与适配验证中心为“1”个核心节点,汇聚区域生态创新中心、ISV合作伙伴及行业领军企业等“N”个节点,旨在通过标准化的适配验证,打通技术到应用的关键环节,解决“点对点”适配难题,加速自主智算解决方案的规模化应用与标杆案例推广,进而构建出一个开放、协同的智算产业生态网络。

在软硬协同与生态网络的推动下,产业界不断将算力转化为可落地的生产力,持续涌现出了不少标杆实践。

在航空领域,南航依托昇腾打造的国产智算底座,研发出了“天策航空求解器”。面对极端天气下的航班恢复难题,通过自主算子库和AI运筹算法,将原本数小时的决策时间压缩至约20分钟。

在能源电力领域,南方电网与华为联合研发“妙算”系列高能效服务器,提出了“算电协同”的理念:通过CPU动态调频、智能风扇温控预测及高效电源优化,实现整机功耗降低13%-15%。

隐藏在上述实践背后的,是产业界合力打造新质生产力的现在进行时,一个开放、协同、高效创新的生态渐行渐近。

04 写在最后
在Token需求爆炸、技术迭代以日计的时代,算力基础设施早已超越了单纯的IT设备,成为了产业向上的核心引擎。

正如我们所看到的:中国计算产业没有选择在旧有架构上修修补补,勇敢地踏入了AI原生计算的“深水区”。从“灵衢”总线打通七大组件的底层协议,到“1+N”CANN生态网络打破算力孤岛,再到昇腾、鲲鹏在千行万业复杂场景中的试炼与智变,为全球产业界提供了可复制、可落地的新选择,也让世界看到了另一种可能。

http://www.jsqmd.com/news/939631/

相关文章:

  • 从DDR4到PCIe 5.0:聊聊Allegro中那些容易被忽略的‘隐性’信号延迟(以Via Z轴延迟为例)
  • 收藏!7个文理兼收的AI高薪岗位,小白也能轻松入门
  • 【ACM稳定出版检索】2026年人工智能与智慧生活国际学术会议 (ICAISL 2026)
  • 计算机毕业设计之基于hadoop的网易云音乐推荐系统的设计与实现
  • 发票、合同、身份证——OCR在金融行业到底替代了多少人工
  • 别再乱调参数了!OpenCV Canny边缘检测的threshold1和threshold2到底怎么设?附实战调参技巧
  • 实战指南:基于快马平台开发智能程控lm317电源,实现实验室精密供电
  • Mixly图形化编程一键接入Blinker物联网的点灯科技扩展包(含ESP32示例与完整开发文件)
  • 不止点灯!用FreeRTOS在GD32F407上实现多任务串口打印与按键响应
  • 保姆级教程:用OpenIPC和WFB-NG在Jetson Orin Nano上搭建低延迟无人机图传(含RTL8812AU驱动避坑)
  • 别再只调PID了!用Mahony算法搞定MPU6050姿态解算(附Arduino代码)
  • 在MacBook M1/M2上用QEMU 8.2跑Windows 10 ARM版:保姆级配置与驱动安装避坑指南
  • 别再只懂k-anonymity了:用Python实战带你搞懂隐私模型三剑客(附代码)
  • 别再死记硬背了!保姆级图解:在银河麒麟V10服务器上配置bond双网卡(附7种模式选择指南)
  • RK3588 Android13广告机项目实战:手把手搞定RTL8852BS的WiFi与蓝牙双模驱动(附完整DTS配置)
  • 告别高斯噪声!手把手教你用DiGress在离散图上玩转扩散模型(附ICLR 2023论文解读)
  • AI工具付费决策全图谱,从LTV/CAC比值、API调用频次到企业级审计支持——技术负责人必读的5步评估法
  • 配置任务计划程序
  • OpenClaw从入门到应用——CLI:Daemon
  • “新增考点专项突破(分布式/微服务/AI)”通常指在技术类考试(如软考高级系统架构设计师、云原生认证、大厂技术面试、AI工程化能力评估等)
  • 告别CheckM1的烦恼:用CheckM2快速筛选高质量宏基因组bin(附保姆级conda安装教程)
  • 告别手动制表:用快马AI自动生成运营数据分析周报,效率提升十倍
  • Anaconda Navigator双击没反应?别急着重装,试试这个保姆级修复流程(附清华源配置)
  • ZYNQ开发避坑指南:手把手教你解决PS与DDR通信的Cache一致性问题
  • 从FXML到EXE:手把手教你用SceneBuilder 21.0 + JDK 17打包独立JavaFX桌面应用(含资源路径避坑指南)
  • 从传统到智能:鲁健如何用AI重构含禁手五子棋的对弈逻辑
  • 基于网络爬虫的XSS漏洞检测系统的设计与实现
  • OpenClaw从入门到应用——CLI:Cron
  • 用MATLAB Simulink给Stewart平台做个‘体检’:从建模到运动仿真全流程
  • 三步快速解密微信聊天记录:WechatDecrypt完整使用指南