元脉网络发布AIGC存储网络解决方案
随着Agent加速进入企业业务流程,算力基建已从单一算力堆叠,迈入“计算-存储-网络”协同优化的新阶段。其中,存储网络凭借高速传输能力,承载着训练、推理全场景的数据流转,是衔接数据与算力的核心枢纽。近日,元脉网络锚定大模型训练、推理全流程需求,发布AIGC存储网络解决方案,助力企业夯实Token时代算力基础设施根基。
训、推业务双重承压 存储网络瓶颈日益凸显
Agent时代,多智能体协作与长上下文记忆,需要高吞吐、低时延的存储网络支撑,其直接影响训练迭代效率、推理响应速度与算力利用率。
其中,训练场景下:
- 数据加载瓶颈:PB级多模态数据集高并发随机读取,引发存储网络I/O瓶颈与服务器过载,要求存储网络具备高吞吐、低时延的数据分发能力;
- Checkpoint瞬间高并发写入:TB级Checkpoint突发写入时,存储网络面临极限带宽压力,要求网络具备高吞吐与先进的拥塞控制,保障写入完整性;同时,训练中断恢复时需快速读取数据,缩短训练中断时间。
而推理场景下:
- 多智能体并发冷启动与弹性扩容:多智能体业务流量突发时,大量GPU节点需并发从存储快速加载多智能体模型,要求存储网络具备极高并发读取带宽;
- 长上下文智能体的历史KV Cache换入/换出:为释放显存,历史KV Cache被冷备份至存储,当对话恢复时,需通过存储网络极速换入。KV Cache的换入/换出,要求存储网络延时低、响应速度快,否则会直接导致首Token响应卡顿,影响智能体交互体验。
元脉AIGC存储网络方案 有效化解训、推难题
针对大模型在训、推场景的核心痛点,元脉网络发布AIGC存储网络解决方案。整套方案融合元脉网络AI交换机、智能网卡及智能运管平台ICE等核心组件,软硬件深度协同,可全方位适配大模型训练、推理全流程的严苛要求,打通数据传输壁垒、释放算力潜能。
端网协同优化 存储读写性能提升40%以上
面对Checkpoint高频归档与断点续训带来的并发读写压力,以及KV Cache换入/换出对响应速度的要求,元脉网络以“AR自适应路由+RTT-CC“的端网协同方案有效化解,实现存储与GPU间的高效数据读写,相比传统RoCE网络,读带宽提升48%,写带宽提升41%。智能体极速就绪与秒级切换 KV Cache读取吞吐量提升至1.4倍
元脉网络AIGC存储网络解决方案,可将KV Cache读取吞吐量提升至1.4倍,大幅缩短智能体服务就绪时间,保障智能体响应速度。为智能体应用构建高吞吐、低时延、无阻塞的存储网络底座,实测数据如下:
- 极速部署、全景可视、快速排障 全面提升部署运维效率
针对存储网络在部署流程繁琐、运维排查复杂、故障定位困难等方面的问题,元脉网络智能运管平台ICE,通过极速部署、全景可视、快速排障三大核心功能,一站式简化存储网络全生命周期管理流程,全方位降低运维人力成本、缩短交付周期,提升整体部署运维效率。
AI赋能未来 互联构筑基石
元脉® 浪潮信息旗下网络业务品牌作为AI时代网络创新引领者,元脉网络可以为用户提供面向AI时代的智算中心、数据中心、园区网络等全栈网络方案。并坚持可靠、开放、智能的发展理念,持续深化自身在技术创新、场景创新、合作创新上的能力,为AI时代算力、数据价值的释放,打造坚实互联基石。
