当前位置: 首页 > news >正文

昆仑芯天池256卡超节点上个月点亮,将于6月正式上市

雷递网 乐天 5月13日

5月13日,在Create2026百度AI开发者大会上,百度创始人李彦宏首次提出AI时代的“度量衡”——日活智能体数(DAA)。他认为,进入智能体时代,衡量一个平台和生态的繁荣,更应该关注DAA,关注有多少Agent在给人类干活,并交付结果。同时他认为,应对智能体的爆发,需要构建“芯云模体”全栈能力。

在此背景下,百度集团执行副总裁、百度智能云事业群总裁沈抖也宣布,基于百度在昆仑芯、AI云、文心大模型、智能体等方面的丰富实践,百度智能云将全面升级为面向大规模智能体应用的新全栈AI云,打造单位Token的智能水平最好的Agent Infra和每瓦性能更强、性价比更高的 AI Infra。

面向Agent时代的新全栈AI云

全面升级的新全栈AI云在Agent Infra与AI Infra两条主线上分别做了提升。

在Agent Infra上,聚焦于将单位Token的智能水平做到最好,原有的“MaaS模型服务”已升级为"Token Factory词元工厂"。以Agent-first理念重构产品架构,尽可能减少token重复计算,推理生成速度较市场水平提升约25%。支持文心、DeepSeek、GLM、MiniMax等国产主流模型的调用,提供更具性价比的token服务。

同时,百度智能云宣布推出"Harness Engineering驾驭工程",覆盖长上下文管理、持久记忆、工具调用、子智能体调度、评估反馈及Runtime等能力模块,并对各模块进行深度协同优化,在使用浏览器、Office等工具来处理办公场景上的任务时,成功率可以达到95%。得益于更优的上下文管理,做同样的任务,需要的对话轮次会更少,相比OpenClaw,可以减少23%的token消耗。

在AI Infra层面,百度智能云在模型训推、集群和数据中心建设等层面,实现突破性进展,可以提供性能最强、最具性价比的AI算力服务。

在推理和训练层面,通过对显存、内存到SSD的分层池化架构,将KV Cache命中率超过90%,达到业界最高水平。另外结合AFD分离、PD分离、缓存调度等优化方案,长链路Agent推理性能较主流开源社区引擎提升3倍。通过提供全模态统一训练框架,让训练效率领先社区1倍以上,并可以在100 毫秒内拉起大量沙箱环境,提升强化学习的采样效率。Agentic模型强化学习效率提升1倍以上。

在支撑训推的算力硬件方面,目前昆仑芯P800已完成规模化验证,2025年至今已交付多个万卡集群。此外在昆仑芯全国产集群上,已完成对文心5.1重要版本的训练,整个集群的有效训练率达到 97%,万卡规模集群线性扩展度超过 85%,已经可以满足前沿大模型大规模训练对计算精度、算子稳定性、框架适配和长周期运行的要求。

百度称,基于昆仑芯的天池256卡超节点已经在上个月点亮,将于6月正式上市,吞吐性能较上一代提升25%,并完成包含文心、DeepSeek、GLM、MiniMax等主流模型的适配,推理效率提升50%,网络架构升级至HPN5.0,端到端时延优化50%,支持按需搭建数十万卡乃至百万卡超大集群。

当天,百度智能云也公布吉瓦级AIDC升级,通过"网络向心布局"设计理念,让计算与网络距离最短,最大限度提升计算效率,规模化落地风液兼容架构,让数据中心的整体建设周期缩短约30%。

新全栈AI云支撑行业新需求

基于这套新全栈AI云,百度智能云当前正为众多行业场景提供智能化服务。

其中,在国货出海领域,百度首次公开亮相的企业级智能营销解决方案Hogee,以及专为企业打造专属视觉智能体"一见Claw",正帮助义乌的"前店后厂"商家迭代为一个个"AI工厂"和"AI店长"。通过一见视觉智能体,可以将海量规则自动配置到每个摄像头上,通过自然语言,一句话识别规则、完成流程处置;而Hogee则通过内置的营销Skill,帮助商家完成从销售导购、销售数据,到库存调货、促销建议等营销全链路工作。

而在汽车行业,百度智能云与长安汽车共建智算中心,基于百度百舸·AI 异构计算平台持续优化,支持长安汽车开展大模型、智能网联与自动驾驶研发相关业务。依托全栈AI能力,目前已成为100%中国主流车企选择,并持续领跑中国自动驾驶研发解决方案市场,累计支持2000万辆搭载 L2级辅助驾驶新车交付。

在硬件领域和具身智能领域,百度智能云保持领先。其在智能手机、AI眼镜、扫地机器人、智能家电行业总计服务超1000家AI硬件厂商,并在具身智能AI云市场保持全面领先,市场份额超过第二、第三名之和。在金融领域,昆仑芯助力招商银行建立起自身AI应用的国产算力底座,支持浦发银行精调金融分析专精模型,提升对公贷款尽调效率。此外,在包括国家电网等大型央企行业范畴,百度智能云目前服务了超80%的央企。

沈抖表示,中国有最完整的产业体系,最丰富的应用场景。未来可能诞生超过100亿活跃智能体,各类沉淀在产业里的知识、经验、工具和流程,未来都会成为可以被智能体承接和放大的能力。

——————————————

雷递由媒体人雷建平创办,若转载请写明来源。

http://www.jsqmd.com/news/815476/

相关文章:

  • 百度网盘Mac版终极加速指南:三步破解限速,免费享受SVIP极速下载
  • TuxGuitar免费吉他谱编辑器:5分钟快速上手指南
  • 终极B站视频下载教程:3分钟学会免费下载4K高清内容
  • 酷跑咔叮为何选择基于 LikeShop 搭建自己的私域数字化平台?——从“租用 SaaS”到“拥有完整卡丁车业务系统”的一次数字化升级实践
  • 别再死记硬背公式了!用Python的NumPy库5分钟搞定逆矩阵、伴随矩阵计算
  • 基于Firecracker的微虚拟机沙箱vmsan:兼顾安全隔离与毫秒级启动
  • 斗鱼股权曝光:腾讯持股40% 陈少杰持股18%
  • 基于Feast构建实时特征存储:架构解析与生产实践指南
  • SQL Server 2022 保姆级安装指南:从下载到配置的完整图解
  • 让STM32的printf也能“上网”:串口重定向后,如何用VS Code+PlatformIO实现无线调试打印?
  • Next.js身份验证实战:基于Auth.js的认证系统设计与实现
  • 响应式编程-Flux 背压机制与操作符链式调用源码剖析
  • Garmin健康数据自动化同步与AI集成实战指南
  • 【RT-DETR实战】030、注意力机制改进:引入SimAM,EMA等无参注意力
  • 终极React Markdown渲染指南:安全高效构建现代内容应用
  • Windows 10/11下用Hydra v9.1测试SSH弱口令?手把手教你搭建本地靶场(附字典避坑指南)
  • 专业PDF文档处理实战指南:掌握高效管理技巧
  • Sora 2生成素材在Final Cut中丢失元数据?揭秘Apple ProRes+JSON Schema双嵌入方案(附可直接导入的XMP模板)
  • 2026临夏市黄金回收白银回收铂金回收店铺哪家好 靠谱门店推荐及联系方式_转自TXT - 盛世金银回收
  • 终极Windows APK安装指南:5分钟快速上手安卓应用安装
  • 如何快速掌握HTTrack网站镜像工具:完整实战指南
  • Windows系统优化终极指南:使用Chris Titus Tech WinUtil一键搞定所有设置
  • DRAM缓存ECC技术:混合方案与直接比较优化
  • 彩云之南常驻春光,昆明大理丽江一路皆风景
  • AI系统内存隔离实战:基于Cgroups与容器的多任务资源保障
  • 基于IHttpClientFactory的Cursor CloudAgents专用HttpClient封装实践
  • 逆向工程与安全测试:如何利用ATR信息识别智能卡类型与潜在风险
  • 基于Docker的Qt5跨平台远程编译环境搭建与实践
  • 免费小说下载器:一键保存全网小说,打造个人数字图书馆
  • 告别繁琐脚本!在STM32CubeIDE里一键调用DAP-LINK调试(保姆级配置)