当前位置: 首页 > news >正文

业内首家!百度智能云率先完成GLM-5 Day0全栈适配

2月12日,智谱正式发布并开源新一代旗舰模型GLM-5。据悉,GLM-5在编程能力上实现了对Claude Opus 4.5的对齐,在业内公认的主流基准测试中取得开源模型SOTA分数。在SWE-bench-Verified和Terminal Bench 2.0中分别获得77.8和56.2的开源模型SOTA分数,性能超过Gemini 3 Pro。在Agent能力上,GLM-5实现开源SOTA,在多个评测基准中取得开源第一,擅长复杂系统工程与长程Agent任务。在全球权威的Artificial Analysis榜单中,GLM-5位居全球第四、开源第一。

当前,百度智能云已完成对GLM-5的Day0适配,百度百舸与昆仑芯支持模型的快速部署与高效推理,百度千帆也将于今日上线该模型。由此,百度智能云成为业内首家实现从底层硬件、计算平台到模型调用服务全栈支持的云厂商。目前,企业客户和开发者可通过百度智能云第一时间体验模型,并通过云端部署充分释放GLM-5的性能潜力,加速业务创新与应用落地。

百度百舸+昆仑芯:

构建国产模型的

坚实算力底座

GLM-5正式发布的同时,百度百舸已同步完成昆仑芯和GLM-5的Day0适配。要实现从芯片到算力集群的全链路适配,离不开大量细致而系统的基础工作。百度智能云依托百度百舸在底层算子优化与工具链建设方面的长期积累,与智谱团队开展协作,围绕GLM-5模型结构与推理特性进行了针对性优化,在模型上线前完成适配与性能调优,保障发布即稳定、高效运行。

百度百舸Day0完成昆仑芯P800和GLM-5适配,用户可以在vLLM、SGLang等推理框架上第一时间进行业务部署。在算力层面,百度混合云基于昆仑芯高性能算子,快速完成GLM-5 DSA和MoE适配,并通过INT8量化、MTP与双机PP并行等优化技术,显著提升GLM-5模型在昆仑芯集群上的推理吞吐。

目前vLLM-Kunlun Plugin已开源GLM-5适配代码,开发者可以在昆仑芯平台快速完成GLM-5的部署,实现了模型”发布即可用”。

( Github 地址:https://github.com/baidu/vLLM-Kunlun/pull/194

模型服务启动配置:

export XPU_VISIBLE_DEVICES=0,1,2,3,4,5,6,7python -m vllm.entrypoints.openai.api_server\ --model /GLM-5-W8A8-INT8-Dynamic \ --tensor-parallel-size 8\ --max_num_batched_tokens 8192\ --block-size 64\ --distributed-executor-backend mp\ --served-model-name glm-5-w8a8

截至目前,百度百舸已在昆仑芯XPU上完成GLM、DeepSeek、Qwen、MiMo V2、Kimi等主流大模型的规模化落地,将主流大模型「发布即可用」常态化,让开发者和用户在模型上线第一时间就能切实享受到国产AI芯片带来的高效加速体验。面向企业及开发者,百度智能云还将持续完善模型适配与部署能力。在集群建设方面,2025年2月,百度智能云成功点亮昆仑芯P800万卡集群,这是国内首个正式点亮的自研万卡AI集群。同年4月,该集群规模进一步扩展至3.2万卡。未来,百度智能云还将不断推进国产算力集群建设,推动模型在真实场景中的规模化应用,助力国产模型的创新发展。

百度Comate接入GLM 5.0,

重塑企业研发效率

作为行业领先的企业级编程智能体,百度文心快码(Comate)已在第一时间完成对GLM 5.0的能力接入,面向全部企业客户开放使用,并面向广大开发者提供试用。依托新一代模型能力,Comate在复杂系统工程处理与长程Agent任务执行上实现显著跃升,在多个企业工作场景中,持续展现高水平的Agentic Engineering能力。

随着大模型能力持续演进与智能体生态不断扩展,百度Comate将持续助力企业构建AI原生研发体系,全面提升研发效率与工程质量,打造行业标杆实践,推动更多组织迈向智能驱动的研发新时代。

百度智能云,

为国产模型创新加速!

百度智能云对GLM-5的全栈Day0适配,体现了国产大模型与自主算力体系协同进化的趋势。依托从芯片、算力集群到云平台的全栈能力建设,百度智能云正持续夯实大模型时代的基础设施底座,推动软硬件体系化融合与规模化落地。目前,百度智能云已持续多年赋能智谱GLM模型迭代优化,双方深度协同构建“模型+算力+场景”生态,正持续突破国产大模型商业应用上限。未来,百度智能云将携手更多的生态伙伴与广大开发者,深化国产模型与国产算力的融合创新,共建开放共赢的大模型生态,加速AI技术在更多真实产业场景中的落地应用,让创新更高效、更可持续。

限时免费!快来百度智能云一键部署OpenClaw

点击“阅读原文”,立即合作咨询!

http://www.jsqmd.com/news/377102/

相关文章:

  • 杰理之打开杰理之家,同时还要打开双MIC产测dut的功能【篇】
  • 杰理之ANC【篇】
  • 杰理之使用外置触摸方案时,需要配置power_pin【篇】
  • 杰理之通话ENC【篇】
  • Claude Code 一小时「复刻」谷歌一年成果,有点震撼了…
  • 杰理之测试盒升级问题注意事项【篇】
  • AI 在提高你工作效率的同时,也一直在增加你的疲惫和焦虑
  • YOLOv12模型优化技巧:提升检测精度的5个方法
  • PETRV2-BEV模型训练:环境配置与依赖安装详解
  • Swin2SR效果展示:老旧地图数字化修复
  • Typora完美搭档:Qwen3-ForcedAligner语音笔记方案
  • 2026年管材管件厂家最新推荐:沈阳ppr管材管件、辽宁pe管材管件、沈阳pvc管材管件、沈阳管材管件、管材管件批发选择指南 - 优质品牌商家
  • 2026年正宗红糖厂家推荐:手工红糖、手工黄冰糖、无添加红糖、无添加黄冰糖、正宗黄冰糖、烘焙专用红糖、甘蔗红糖选择指南 - 优质品牌商家
  • uni-app——uni-app 小程序 input 在 scroll-view 中悬浮错位的原因与解决方案
  • 一键体验丹青识画:上传图片秒获水墨题跋
  • Lingyuxiu MXJ LoRA与计算机网络:分布式人像生成系统设计
  • uni-app—— uni-app 小程序页面返回时状态丢失问题的解决方案
  • Retinaface+CurricularFace在Node.js中的应用:人脸识别服务开发
  • 2026年UG数控编程培训公司权威推荐:UG编程培训、UG4轴5轴编程培训、UG数控车编程培训、数控车床培训、UG多轴编程培训选择指南 - 优质品牌商家
  • 造相 Z-Image 文旅融合:景区IP形象图/文创产品图自动化生成
  • 模型解释性组件:从黑盒到玻璃盒的技术演进与深度实践
  • 移动云在政务云市场地位怎样?
  • 基于RexUniNLU的智能邮件分类与处理系统
  • 基于RexUniNLU的智能邮件分类与处理系统
  • BERT中文文本分割模型部署避坑:显存优化与推理加速技巧
  • Visio流程图:RMBG-2.0系统架构设计
  • FLUX.1-dev电商解决方案:基于卷积神经网络的智能商品图生成
  • PowerPaint-V1修图技巧:让照片瑕疵消失的魔法工具
  • 自动驾驶入门:PETRV2-BEV模型训练保姆级教程
  • Qwen3-VL-8B性能优化:如何在低配设备上流畅运行