当前位置: 首页 > news >正文

ZStack Cloud 5.5.16重磅更新:裸金属性能跃升,AI算力实现“按需分配” - 博客万

GPU 正在成为企业 AI 建设中"最昂贵的资产",却也往往是最容易被闲置的资源。在研发测试、轻量推理、模型验证、教学实验等场景下,整卡分配的方式造成了大量显存闲置和成本浪费。如何将昂贵的算力切碎,提供按需分配、灵活回收的细粒度服务,成为了降本增效的关键。

近日,ZStack Cloud 5.5.16 正式发布。本次升级的核心,是推出 dGPU(动态 GPU)算力切分技术,打破了整卡分配的物理限制,让云主机能够按需动态加载与释放显存,将一张物理卡切分为多份贴合业务实际的算力单元。同时,DPU 加速弹性裸金属企业级网络增强等能力也在同一版本中同步上线。

ZStack Cloud 5.5.16 版本的核心功能包括:

●  弹性裸金属增强:引入 DPU加速 技术,实现网络与存储的硬件级卸载,彻底释放主机算力;支持 Ceph块存储作为系统盘,大幅提升I/O性能并保障业务高可用;新增 灾备支持,为关键业务提供多重安全保障。

●  AI 算力增强:创新推出 dGPU(dynamic GPU) 技术,打破物理显存限制,实现算力的按需分配,最大化昂贵GPU资源的利用率;新增 GPU 全局及规格级分配策略(紧凑/分散),灵活平衡业务高可用与资源利用率。全面支持 国产算力(昇腾/海光) 的统一监控。

●  云网络能力增强:支持网卡IP、掩码、网关及DNS的 全自定义配置,满足复杂网络环境需求;新增 VPC路由器SNAT转发溯源,满足严格的网络安全合规审计要求;负载均衡支持 端口级精细化转发,提升业务管理的灵活性。

重点特性介绍

弹性裸金属增强:性能跃升,安全无忧

新增DPU加速弹性裸金属集群

本次更新重磅引入 DPU 技术,重构弹性裸金属集群架构。通过DPU设备直接管理裸金属节点,实现了 去中心化设计,彻底消除单点故障隐患。

利用DPU的硬件卸载能力实现虚拟网络的加速,结合高性能的存储引擎(SPDK)加速分布式存储,大幅降低了主机CPU的负载,显著提升了存储IOPS与网络吞吐性能,为数据库、高性能计算等关键业务提供了极致的物理机体验。

创建DPU加速弹性裸金属集群

DPU加速集群目前支持对接Ceph主存储,可基于Ceph主存储创建弹性裸金属实例并实现核心运维功能,包括创建、启动、停止、删除、加/卸载Ceph云盘等。

支持使用Ceph块存储卷作为弹性裸金属系统盘

新版本打破了传统限制,支持将 Ceph块存储卷 作为弹性裸金属实例的系统盘。这一特性不仅有效提升了系统盘的读写性能,更通过多路径机制实现了存储层面的冗余,避免了单点故障,从底层保障了业务的连续性与高可用。

Ceph块存储卷作弹性裸金属系统盘

弹性裸金属实例支持灾备

为了应对数据安全风险,新版本全面支持弹性裸金属实例的 全量备份与一键恢复。用户可按需选择仅备份系统盘,或同时备份已加载的数据盘(不包含共享云盘),并在需要时进行一键恢复。

该能力为运行在弹性裸金属上的数据库、核心业务系统、高性能应用等提供更完善的数据保护机制,帮助企业降低误操作、故障或其他异常情况下的数据安全风险。

弹性裸金属实例备份(含数据盘)

AI 算力增强:资源切分,国产适配

新增云主机 dGPU (动态 GPU) 软件切分能力

dGPU 是这次 5.5.16 版本最重要的能力升级。在虚拟化场景里,主流做法是把整张 GPU 直通给单台云主机,研发测试、轻量推理这类不需要满血算力的业务也只能独占整卡,结果是 GPU 利用率长期偏低,算力成本被严重浪费。

ZStack Cloud 基于 CUDA API 拦截转发技术实现 dGPU 切分能力,平台无需预先对整卡做静态划分,云主机可以按需动态加载和释放显存。一张大显存物理卡能够被切分为多份细粒度算力,同时分配给多个云主机使用。 这是当前云平台市场上的差异化能力,把 GPU 这种高价资源从"独占式"使用方式带入"按需共享"。

dGPU 资源深度融入云平台管理体系,支持显存规格模板配置、部门/项目级配额管控以及实时健康监控。对于 AI 研发团队和教学实验场景,这意味着同样一张 H100 或 A100,可以同时支撑多个研发人员、多个推理服务、多个验证任务,显著降低 AI 研发的算力门槛和投入成本。

创建云主机加载dGPU

新增 GPU 全局及规格级分配策略

新版本新增 GPU 全局及规格级分配策略,支持 “分散优先” 与 “紧凑优先” 两种模式,让用户可根据业务特性灵活编排算力资源。

●      分散优先:适用于高可用场景,将 GPU 业务尽可能分布在不同物理节点,降低单点故障影响;

●      紧凑优先:适用于资源利用率优先场景,优先填满单节点后再调度下一节点,便于保留完整空闲节点以承载大模型训练等高规格任务。

通过更精细的调度策略,企业可在 AI 训练、推理、研发测试等多类型任务并行运行时,更好地平衡业务连续性与资源利用效率。

设置 GPU 分配策略

GPU 运维支持容器国产算力 (昇腾/海光) 的监控

在信创与国产化趋势下,新版本进一步完善了对国产芯片的支持。容器集群现已支持查看 昇腾、海光等国产芯片的详细监控数据,实现了异构算力的统一纳管与可视化运维,助力企业构建自主可控的AI算力底座。

查看国产 GPU 监控数据

云网络能力增强:灵活配置,合规溯源

支持网卡网络参数自定义配置

为了适配更复杂的业务场景与混合云环境,新版本赋予了用户更高的网络配置自由度。现在,用户可为云主机网卡灵活指定 IP地址,并独立设置 子网掩码、网关及DNS。这一改进提升云主机在混合云、专有网络、复杂业务系统迁移等场景中的网络适配能力。

单独设置IP地址、网关、子网掩码、DNS

支持VPC路由器SNAT转发溯源

面对日益严格的安全合规要求,新版本在VPC路由器开启SNAT功能后,支持 记录转发日志。用户只需添加SNAT日志服务器并开启开关,即可轻松实现IP转发的溯源审计,满足企业级网络的安全合规需求。

开启VPC路由器SNAT日志开关

添加SNAT日志服务器

负载均衡监听器转发规则支持单独指定端口

新版本优化了负载均衡的精细化管理能力,支持为转发规则 单独指定后端服务器组端口。这意味着,来自不同域名或URL的请求可以被精准分发到后端服务器组的特定服务端口,实现了更灵活的业务路由与微服务管理。

转发规则指定后端服务器组端口

其他优化

ZStack Cloud 5.5.16 版本还针对用户在日常运维中的痛点进行了大量体验升级:

●      集群绑定机制简化:将复杂的绑定逻辑简化为“强/弱绑定”两种模式,并支持集群粒度的一键开启与实例级的灵活覆盖,满足了混合业务场景的调度需求。

●      VNC控制台全屏化:优化了云主机的远程操作体验,支持全屏展示,消除视觉干扰,提升运维效率。

●      底层环境升级:Python 版本升级至 3.11,不仅提升了运行效率,更增强了系统的安全性与长期维护能力。

●      AI部署效率提升:创建推理服务UI全面优化,提供默认配置;支持云主机通过 virtio-fs一键挂载自定义模型,系统自动生成启动命令;支持 AI业务跨项目统一下发,解决了跨团队资源交付的繁琐流程。

●      资源利用率优化:推理容器支持 CPU/内存申请量与限制量分离,完美解决模型“启动吃内存、运行低消耗”的资源闲置痛点。

●      体验优化:模型管理降本增效, 支持模型下载断点续传与去重校验,并增强 GPU 资源概览与云主机/容器监控的可视化展示。

●      国产适配:新增支持阿里 PPU-ZW810E 芯片推理和精调模型, 国产算力生态更加多样。为客户在信创及国产算力场景下提供更多硬件选择,降低供应链风险。

●      模型引擎:新版本升级了 vLLM/MindIE 等核心推理系统模板,对底层性能进行了深度优化。用户无需繁琐的环境配置,即可“开箱即用”最新发布的主流开源模型(如Qwen3.5),大幅缩短了从模型下载到服务上线的周期。

●      系统稳定性加固:优化了双管理节点同步机制、云平台升级体验及 KVM Agent 内存管理,进一步降低了边缘场景故障风险,提升了物理机长期运行的稳定性。

ZStack Cloud云平台的每一次更新,都源于对真实运维场景的洞察与响应。我们相信,技术的价值在于切实解决问题、提升效率。未来,我们将继续围绕 “简单、健壮、弹性、智能” 的核心理念,让云平台成为企业数字化转型中更可靠、更高效的基石。

ZStack Cloud 5.5.16 已正式发布。如果企业内部正在评估弹性裸金属、AI 算力切分或异构 GPU 监控等场景,欢迎移步云轴科技ZStack官网,联系 ZStack 各区域团队,了解新版本特性。

http://www.jsqmd.com/news/769886/

相关文章:

  • IoTDB数据库SQL操作避坑指南:从创建root.开头的库到时间戳数据写入的实战细节
  • 2026年新疆不干胶标签、票据印刷与办公用纸采购完全指南 - 企业名录优选推荐
  • 深蓝词库转换:彻底告别输入法切换烦恼的终极解决方案
  • 三步解锁百度网盘高速下载:告别龟速,拥抱光速
  • C# UI界面的绘制
  • Snap.Hutao:现代化Windows平台原神工具箱的专业级解决方案
  • 从Excel筛选到Pandas删除:用.drop()方法搞定你的数据清洗日常(新手友好版)
  • 深圳地区做出口模胚的加工厂家 - 昌晖模胚
  • 2026年新疆票据印刷、不干胶标签及办公用纸全区域完全指南 - 企业名录优选推荐
  • 2026年锡膏粘度计采购全攻略:选型技巧与厂家品牌甄选 - 品牌推荐大师1
  • 压力变送器品牌排行:2026高性价比选购白皮书 - 品牌推荐大师1
  • AI驱动多链永续合约流动性引擎:架构、实现与实战
  • FreeRTOS实战:从裸机到多任务,手把手教你用DHT11温湿度传感器改造智能家居项目
  • 基于AgentSkills构建个性化AI陪伴技能:以“妈妈.skill”为例
  • 终极指南:dnSpyEx .NET调试与反编译工具的高效配置秘籍
  • 阜阳街坊私下传的话:卖金找金润阁回收,这话没花过一分广告费 - 福正美黄金回收
  • 2026年工业翅片管换热元件厂家推荐:双金属翅片管/不锈钢翅片管/KL型翅片管专业供应 - 品牌推荐官
  • B站字幕提取方法全攻略:从下载视频到一键导出字幕的完整实操
  • PBR-White-Paper抗锯齿技术:TAA时域抗锯齿在PBR渲染中的优化应用
  • 用东华OJ的50道经典题,带你系统性巩固C++编程核心语法
  • 2026螺旋钢管 6 大品牌实测测评|工程采购选型指南 - 深度智识库
  • 在Windows上安装安卓应用:APK Installer的实用指南
  • AI应用合规筛查实战:基于MCP协议的出口管制内容检测与集成
  • 3分钟搞定QQ音乐加密文件:qmcdump终极解码指南
  • Win11 + Optimus + HDMI 高刷超宽屏导致 WATCHDOG / TDR / Explorer 卡死 的一次完整排障记录
  • 为自动化客服工单处理流程集成 taotoken 的智能分类与摘要能力
  • 2026年一体陶瓷浴室柜公司最新推荐榜:一体陶瓷浴室柜推荐品牌找哪家好/一体陶瓷浴室柜定制找哪家/迪普瑞卫浴厂家哪家好 - 品牌策略师
  • 广州GEO优化运营技术拆解:头部服务商核心能力盘点 - 奔跑123
  • 2026最新化妆品包装盒定制公司推荐!国内优质权威榜单发布,实力靠谱广东佛山等地公司首选 - 十大品牌榜
  • 国产替代之FQD6N40TM与VBE14R04参数对比报告