当前位置：首页 > news >正文

PAI支持一键部署GLM-5.2，Coding能力比肩Claude Opus 4.8

news 2026/7/3 4:48:03

模型介绍

近日，智谱全新开源 GLM-5.2！PAI 平台现已支持 GLM-5.2 模型，一键即可部署调用!

GLM-5.2 支持1M 无损上下文，在长程任务中保持领先，多个长程任务基准均为开源最强模型；提供更强体感、更实用的Coding 能力，在主流编程基准上，GLM-5.2 保持开源 SOTA，与 Claude Opus 4.8 处于可比区间；通过模型架构、推理系统和训练基础设施的协同设计，带来极致 Infra 优化。

在全球百万用户参与盲测的前端开发评估系统 Code Arena 上，GLM-5.2 取得全球可用模型第一的表现。

除 GLM-5.2 外，PAI-Model Gallery 同样支持MiniMax M3、Kimi K2.7 Code、Qwen3.6、DeepSeek-V4、GLM-5.1等前沿模型的一键部署。其中 DeepSeek-V4 支持Deepseek-V4-Pro 和 Deepseek-V4-Flash 全系列模型，含 FP8/Int8 量化版，并可使用真武 810E 高效支持推理需求（DeepSeek-V4-Flash-Int8-W8A8）！

一键部署 GLM-5.2 模型

在 PAI-Model Gallery 模型广场找到GLM-5.2模型，或通过链接直达该模型：

GLM-5.2：https://pai.console.aliyun.com/#/quick-start/models/GLM-5.2/intro
GLM-5.2-FP8：https://pai.console.aliyun.com/#/quick-start/models/GLM-5.2-FP8/intro

在模型详情页右上角点击「部署」，选择计算资源后，即可一键完成云上部署。

GLM-5.2 支持 vLLM 高性能部署框架 / SGLang 高性能部署框架，支持分布式部署，需 16*GPU 或以上资源；
GLM-5.2-FP8 支持 vLLM 高性能部署框架 / SGLang 高性能部署框架，支持单机部署，需 8*GPU 或以上资源；

部署成功后，在服务页面可以点击“查看调用信息”获取调用的调用地址和 Token，想了解服务调用方式可以点击模型详情页，查看调用方式说明。

PAI-Model Gallery 简介

Model Gallery 是阿里云人工智能平台 PAI 的产品组件，它集成了国内外 AI 开源社区中优质的预训练模型，涵盖了 LLM、AIGC、CV、NLP 等各个领域。通过 PAI 对这些模型的适配，用户可以以零代码方式实现从训练到部署再到推理的全过程，简化了模型的开发流程，为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。

PAI-Model Gallery 访问地址：https://pai.console.aliyun.com/#/quick-start/models

阿里云 PAI-Model Gallery 已同步接入 GLM-5.2、Kimi K2.7 Code、MiniMax M3、Kimi K2.7 Code、Qwen3.6-35B-A3B 与 DeepSeek-V4 等最新主流模型，提供企业级部署方案。

✅ 零代码一键部署

✅ 自动适配云资源

✅ 开箱即用API

✅ 全流程运维托管

✅ 企业级安全数据不出域

PAI支持一键部署GLM-5.2，Coding能力比肩Claude Opus 4.8

模型介绍

一键部署 GLM-5.2 模型

PAI-Model Gallery 简介

更多模型支持

相关文章：