当前位置：首页 > news >正文

ZStack Cloud 5.5.16重磅更新：裸金属性能跃升，AI算力实现“按需分配” - 博客万

news 2026/5/7 11:48:05

GPU 正在成为企业 AI 建设中"最昂贵的资产"，却也往往是最容易被闲置的资源。在研发测试、轻量推理、模型验证、教学实验等场景下，整卡分配的方式造成了大量显存闲置和成本浪费。如何将昂贵的算力切碎，提供按需分配、灵活回收的细粒度服务，成为了降本增效的关键。

近日，ZStack Cloud 5.5.16 正式发布。本次升级的核心，是推出 dGPU（动态 GPU）算力切分技术，打破了整卡分配的物理限制，让云主机能够按需动态加载与释放显存，将一张物理卡切分为多份贴合业务实际的算力单元。同时，DPU 加速弹性裸金属、企业级网络增强等能力也在同一版本中同步上线。

ZStack Cloud 5.5.16 版本的核心功能包括：

● 弹性裸金属增强：引入 DPU加速 技术，实现网络与存储的硬件级卸载，彻底释放主机算力；支持 Ceph块存储作为系统盘，大幅提升I/O性能并保障业务高可用；新增 灾备支持，为关键业务提供多重安全保障。

● AI 算力增强：创新推出 dGPU（dynamic GPU） 技术，打破物理显存限制，实现算力的按需分配，最大化昂贵GPU资源的利用率；新增 GPU 全局及规格级分配策略（紧凑/分散），灵活平衡业务高可用与资源利用率。全面支持 国产算力（昇腾/海光） 的统一监控。

● 云网络能力增强：支持网卡IP、掩码、网关及DNS的 全自定义配置，满足复杂网络环境需求；新增 VPC路由器SNAT转发溯源，满足严格的网络安全合规审计要求；负载均衡支持 端口级精细化转发，提升业务管理的灵活性。

重点特性介绍

弹性裸金属增强：性能跃升，安全无忧

新增DPU加速弹性裸金属集群

本次更新重磅引入 DPU 技术，重构弹性裸金属集群架构。通过DPU设备直接管理裸金属节点，实现了 去中心化设计，彻底消除单点故障隐患。

利用DPU的硬件卸载能力实现虚拟网络的加速，结合高性能的存储引擎（SPDK）加速分布式存储，大幅降低了主机CPU的负载，显著提升了存储IOPS与网络吞吐性能，为数据库、高性能计算等关键业务提供了极致的物理机体验。

创建DPU加速弹性裸金属集群

DPU加速集群目前支持对接Ceph主存储，可基于Ceph主存储创建弹性裸金属实例并实现核心运维功能，包括创建、启动、停止、删除、加/卸载Ceph云盘等。

支持使用Ceph块存储卷作为弹性裸金属系统盘

新版本打破了传统限制，支持将 Ceph块存储卷 作为弹性裸金属实例的系统盘。这一特性不仅有效提升了系统盘的读写性能，更通过多路径机制实现了存储层面的冗余，避免了单点故障，从底层保障了业务的连续性与高可用。

Ceph块存储卷作弹性裸金属系统盘

弹性裸金属实例支持灾备

为了应对数据安全风险，新版本全面支持弹性裸金属实例的 全量备份与一键恢复。用户可按需选择仅备份系统盘，或同时备份已加载的数据盘（不包含共享云盘），并在需要时进行一键恢复。

该能力为运行在弹性裸金属上的数据库、核心业务系统、高性能应用等提供更完善的数据保护机制，帮助企业降低误操作、故障或其他异常情况下的数据安全风险。

弹性裸金属实例备份（含数据盘）

AI 算力增强：资源切分，国产适配

新增云主机 dGPU (动态 GPU) 软件切分能力

dGPU 是这次 5.5.16 版本最重要的能力升级。在虚拟化场景里，主流做法是把整张 GPU 直通给单台云主机，研发测试、轻量推理这类不需要满血算力的业务也只能独占整卡，结果是 GPU 利用率长期偏低，算力成本被严重浪费。

ZStack Cloud 基于 CUDA API 拦截转发技术实现 dGPU 切分能力，平台无需预先对整卡做静态划分，云主机可以按需动态加载和释放显存。一张大显存物理卡能够被切分为多份细粒度算力，同时分配给多个云主机使用。 这是当前云平台市场上的差异化能力，把 GPU 这种高价资源从"独占式"使用方式带入"按需共享"。

dGPU 资源深度融入云平台管理体系，支持显存规格模板配置、部门/项目级配额管控以及实时健康监控。对于 AI 研发团队和教学实验场景，这意味着同样一张 H100 或 A100，可以同时支撑多个研发人员、多个推理服务、多个验证任务，显著降低 AI 研发的算力门槛和投入成本。

创建云主机加载dGPU

新增 GPU 全局及规格级分配策略

新版本新增 GPU 全局及规格级分配策略，支持 “分散优先” 与 “紧凑优先” 两种模式，让用户可根据业务特性灵活编排算力资源。

● 分散优先：适用于高可用场景，将 GPU 业务尽可能分布在不同物理节点，降低单点故障影响；

● 紧凑优先：适用于资源利用率优先场景，优先填满单节点后再调度下一节点，便于保留完整空闲节点以承载大模型训练等高规格任务。

通过更精细的调度策略，企业可在 AI 训练、推理、研发测试等多类型任务并行运行时，更好地平衡业务连续性与资源利用效率。

设置 GPU 分配策略

GPU 运维支持容器国产算力 (昇腾/海光) 的监控

在信创与国产化趋势下，新版本进一步完善了对国产芯片的支持。容器集群现已支持查看 昇腾、海光等国产芯片的详细监控数据，实现了异构算力的统一纳管与可视化运维，助力企业构建自主可控的AI算力底座。

查看国产 GPU 监控数据

云网络能力增强：灵活配置，合规溯源

支持网卡网络参数自定义配置

为了适配更复杂的业务场景与混合云环境，新版本赋予了用户更高的网络配置自由度。现在，用户可为云主机网卡灵活指定 IP地址，并独立设置 子网掩码、网关及DNS。这一改进提升云主机在混合云、专有网络、复杂业务系统迁移等场景中的网络适配能力。

单独设置IP地址、网关、子网掩码、DNS

支持VPC路由器SNAT转发溯源

面对日益严格的安全合规要求，新版本在VPC路由器开启SNAT功能后，支持 记录转发日志。用户只需添加SNAT日志服务器并开启开关，即可轻松实现IP转发的溯源审计，满足企业级网络的安全合规需求。

开启VPC路由器SNAT日志开关

添加SNAT日志服务器

负载均衡监听器转发规则支持单独指定端口

新版本优化了负载均衡的精细化管理能力，支持为转发规则 单独指定后端服务器组端口。这意味着，来自不同域名或URL的请求可以被精准分发到后端服务器组的特定服务端口，实现了更灵活的业务路由与微服务管理。

转发规则指定后端服务器组端口

其他优化

ZStack Cloud 5.5.16 版本还针对用户在日常运维中的痛点进行了大量体验升级：

● 集群绑定机制简化：将复杂的绑定逻辑简化为“强/弱绑定”两种模式，并支持集群粒度的一键开启与实例级的灵活覆盖，满足了混合业务场景的调度需求。

● VNC控制台全屏化：优化了云主机的远程操作体验，支持全屏展示，消除视觉干扰，提升运维效率。

● 底层环境升级：Python 版本升级至 3.11，不仅提升了运行效率，更增强了系统的安全性与长期维护能力。

● AI部署效率提升：创建推理服务UI全面优化，提供默认配置；支持云主机通过 virtio-fs一键挂载自定义模型，系统自动生成启动命令；支持 AI业务跨项目统一下发，解决了跨团队资源交付的繁琐流程。

● 资源利用率优化：推理容器支持 CPU/内存申请量与限制量分离，完美解决模型“启动吃内存、运行低消耗”的资源闲置痛点。

● 体验优化：模型管理降本增效, 支持模型下载断点续传与去重校验，并增强 GPU 资源概览与云主机/容器监控的可视化展示。

● 国产适配：新增支持阿里 PPU-ZW810E 芯片推理和精调模型, 国产算力生态更加多样。为客户在信创及国产算力场景下提供更多硬件选择，降低供应链风险。

● 模型引擎：新版本升级了 vLLM/MindIE 等核心推理系统模板，对底层性能进行了深度优化。用户无需繁琐的环境配置，即可“开箱即用”最新发布的主流开源模型（如Qwen3.5），大幅缩短了从模型下载到服务上线的周期。

● 系统稳定性加固：优化了双管理节点同步机制、云平台升级体验及 KVM Agent 内存管理，进一步降低了边缘场景故障风险，提升了物理机长期运行的稳定性。

ZStack Cloud云平台的每一次更新，都源于对真实运维场景的洞察与响应。我们相信，技术的价值在于切实解决问题、提升效率。未来，我们将继续围绕 “简单、健壮、弹性、智能” 的核心理念，让云平台成为企业数字化转型中更可靠、更高效的基石。

ZStack Cloud 5.5.16 已正式发布。如果企业内部正在评估弹性裸金属、AI 算力切分或异构 GPU 监控等场景，欢迎移步云轴科技ZStack官网，联系 ZStack 各区域团队，了解新版本特性。

查看全文

http://www.jsqmd.com/news/769886/

IoTDB数据库SQL操作避坑指南：从创建root.开头的库到时间戳数据写入的实战细节

2026年新疆不干胶标签、票据印刷与办公用纸采购完全指南 - 企业名录优选推荐

深蓝词库转换：彻底告别输入法切换烦恼的终极解决方案

三步解锁百度网盘高速下载：告别龟速，拥抱光速

C# UI界面的绘制

Snap.Hutao：现代化Windows平台原神工具箱的专业级解决方案

从Excel筛选到Pandas删除：用.drop()方法搞定你的数据清洗日常（新手友好版）

深圳地区做出口模胚的加工厂家 - 昌晖模胚

2026年新疆票据印刷、不干胶标签及办公用纸全区域完全指南 - 企业名录优选推荐

2026年锡膏粘度计采购全攻略：选型技巧与厂家品牌甄选 - 品牌推荐大师1

压力变送器品牌排行：2026高性价比选购白皮书 - 品牌推荐大师1

AI驱动多链永续合约流动性引擎：架构、实现与实战

FreeRTOS实战：从裸机到多任务，手把手教你用DHT11温湿度传感器改造智能家居项目

基于AgentSkills构建个性化AI陪伴技能：以“妈妈.skill”为例

终极指南：dnSpyEx .NET调试与反编译工具的高效配置秘籍

阜阳街坊私下传的话：卖金找金润阁回收，这话没花过一分广告费 - 福正美黄金回收

B站字幕提取方法全攻略:从下载视频到一键导出字幕的完整实操

PBR-White-Paper抗锯齿技术：TAA时域抗锯齿在PBR渲染中的优化应用

用东华OJ的50道经典题，带你系统性巩固C++编程核心语法

2026螺旋钢管 6 大品牌实测测评｜工程采购选型指南 - 深度智识库

在Windows上安装安卓应用：APK Installer的实用指南

AI应用合规筛查实战：基于MCP协议的出口管制内容检测与集成

3分钟搞定QQ音乐加密文件：qmcdump终极解码指南

Win11 + Optimus + HDMI 高刷超宽屏导致 WATCHDOG / TDR / Explorer 卡死的一次完整排障记录

为自动化客服工单处理流程集成 taotoken 的智能分类与摘要能力

广州GEO优化运营技术拆解：头部服务商核心能力盘点 - 奔跑123

国产替代之FQD6N40TM与VBE14R04参数对比报告

相关文章：