当前位置: 首页 > news >正文

PAI支持一键部署GLM-5.2,Coding能力比肩Claude Opus 4.8

模型介绍

近日,智谱全新开源 GLM-5.2!PAI 平台现已支持 GLM-5.2 模型,一键即可部署调用!

GLM-5.2 支持1M 无损上下文,在长程任务中保持领先,多个长程任务基准均为开源最强模型;提供更强体感、更实用的Coding 能力,在主流编程基准上,GLM-5.2 保持开源 SOTA,与 Claude Opus 4.8 处于可比区间;通过模型架构、推理系统和训练基础设施的协同设计,带来极致 Infra 优化。

在全球百万用户参与盲测的前端开发评估系统 Code Arena 上,GLM-5.2 取得全球可用模型第一的表现。

除 GLM-5.2 外,PAI-Model Gallery 同样支持MiniMax M3、Kimi K2.7 Code、Qwen3.6、DeepSeek-V4、GLM-5.1等前沿模型的一键部署。其中 DeepSeek-V4 支持Deepseek-V4-Pro 和 Deepseek-V4-Flash 全系列模型,含 FP8/Int8 量化版,并可使用真武 810E 高效支持推理需求(DeepSeek-V4-Flash-Int8-W8A8)!

一键部署 GLM-5.2 模型

  1. 在 PAI-Model Gallery 模型广场找到GLM-5.2模型,或通过链接直达该模型:
  • GLM-5.2:https://pai.console.aliyun.com/#/quick-start/models/GLM-5.2/intro

  • GLM-5.2-FP8:https://pai.console.aliyun.com/#/quick-start/models/GLM-5.2-FP8/intro

  1. 在模型详情页右上角点击「部署」,选择计算资源后,即可一键完成云上部署。

  • GLM-5.2 支持 vLLM 高性能部署框架 / SGLang 高性能部署框架,支持分布式部署,需 16*GPU 或以上资源;

  • GLM-5.2-FP8 支持 vLLM 高性能部署框架 / SGLang 高性能部署框架,支持单机部署,需 8*GPU 或以上资源;

  1. 部署成功后,在服务页面可以点击“查看调用信息”获取调用的调用地址和 Token,想了解服务调用方式可以点击模型详情页,查看调用方式说明。

PAI-Model Gallery 简介

Model Gallery 是阿里云人工智能平台 PAI 的产品组件,它集成了国内外 AI 开源社区中优质的预训练模型,涵盖了 LLM、AIGC、CV、NLP 等各个领域。通过 PAI 对这些模型的适配,用户可以以零代码方式实现从训练到部署再到推理的全过程,简化了模型的开发流程,为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。

PAI-Model Gallery 访问地址:https://pai.console.aliyun.com/#/quick-start/models

阿里云 PAI-Model Gallery 已同步接入 GLM-5.2、Kimi K2.7 Code、MiniMax M3、Kimi K2.7 Code、Qwen3.6-35B-A3B 与 DeepSeek-V4 等最新主流模型,提供企业级部署方案。

✅ 零代码一键部署

✅ 自动适配云资源

✅ 开箱即用API

✅ 全流程运维托管

✅ 企业级安全 数据不出域

更多模型支持

PAI-Model Gallery 持续提供开源社区热门模型的快速部署、微调、蒸馏、评测实践,模型覆盖Qwen、Wan、DeepSeek、Kimi、MiniMax等优秀开源模型,同时还提供 Qwen3-235B-A22B-PAI-optimized、Qwen3-Next-80B-A3B-Instruct-FP8-PAI-optimized、DeepSeek-R1-0528-PAI-optimized 等 PAI 优化版本模型,内置了 PAI 优化版的 EP+PD 分离部署等模板,性能更优。

联系我们
欢迎各位小伙伴持续关注使用 PAI-Model Gallery,平台会不断上线 SOTA 模型,如果您有任何模型需求,也可以联系我们。您可通过搜索钉钉群号(77450028832),加入 PAI-Model Gallery 用户交流群。

http://www.jsqmd.com/news/1113218/

相关文章:

  • Python控制流完全指南
  • 工程成本管理系统如何精准控支出,规避超支核算滞后与盈亏模糊问题
  • 全球首份大语言模型安全防范能力测评报告在北京发布
  • 内网渗透测试中SharpScan工具的5个关键配置错误与规避策略
  • Linux第四次实验作业
  • CNC五轴加工干货:一文看懂哪些零件适合选这种工艺
  • Java加密开发实战:InvalidKeyException异常深度解析与解决方案
  • 国内四向车公司有哪些?2026年头部玩家实力对比
  • Linux的基础知识和常见命令
  • 模拟开关和继电器该怎么选?
  • 福特:曾借 AI 裁员,如今召回资深工程师修复系统,还称未放弃 AI
  • ORB-SLAM3 DetectRelocalizationCandidates
  • 如何用STM32F103C8T6实现精准温度控制:从零开始的完整项目指南
  • 【JAVA毕设源码分享】基于springboot通用预约系统的设计与实现(程序+文档+代码讲解+一条龙定制)
  • Burp Suite API实战:从Extender插件到REST API的自动化安全测试
  • 大模型推理总是卡顿?你可能被传统的“三网分离”网络架构坑了
  • 网盘直链下载助手:2025年最实用的八大网盘高速下载解决方案
  • 一文搞懂 GEO,AI 时代取代 SEO 的全新优化逻辑
  • 数字人口播怎么做获客?从内容生产到信任建立的一套思路(2026)
  • 小型语言模型SLM:面向边缘设备的智能引擎设计与落地
  • 一洽邮箱接入
  • 微博上的世界杯品牌营销:中国品牌如何把广告变成“社交梗“
  • 部署nginx多站点游戏
  • 开源扫地机器人 OOMWOO 项目启动:可自造、本地运行,邀你参与构建!
  • 为什么新手也能搞定朱雀检测?
  • gRPC微服务安全加固实战:从TLS配置到纵深防御的六层防护
  • 告别高额研发、数据孤岛,中钧科技全流程助力实体经济数字化升级!
  • 数字人营销视频工具推荐:适合品牌获客与内容转化的选择思路(2026)
  • 第一章Netty,Worker代码优化后分析
  • 欧朋浏览器推新防护功能,可防“点击修复”攻击!