当前位置: 首页 > news >正文

暴雨装备:今年国内AI服务器规模大幅增长

近日,暴雨金融行业部方案架构师李伟在上海金融展上接受记者采访时透露,受益于智算需求的爆发式增长,以及金融、互联网等行业加快建设安全可靠AI基础设施,暴雨搭载国内GPU和CPU的服务器规模今年将大幅增长。

生成式AI和智能体应用加速落地,正在推动中国算力产业进入新一轮扩张周期。中国信通院数据显示,今年一季度国内AI算力需求同比暴涨417%,而供给增速仅128%。

供需失衡之下,算力市场正步入量价齐升期。而对安全可靠算力的需求亦在加速释放。

作为国内头部算力基础设施厂商,暴雨装备主营业务涵盖服务器、PC等计算产品。金融是其业务中的一个重要板块。

“金融行业对安全可靠的要求很高,也是安全可信路线推进最快、标准最严的领域。”李伟指出。

随着生成式AI与智能体加速在金融机构的业务场景中落地,行业算力需求结构正发生显著变化。信贷审批、合规审核、保险理赔等场景对算力的消耗量激增,这类业务往往需调用征信信息、资产数据、监管政策等信息与数据,并进行多轮推理与交叉验证,单次业务流程可产生海量Token需求。

除了金融行业外,教育、政务、能源、交通、医疗、电信、电力、航空航天等行业也在加速推进安全可靠算力基础设施建设。

作为产业链上游的服务器厂商,暴雨直观感受到此轮需求的快速升温。暴雨AI产品线负责人刘伟透露:“今年公司搭载国内CPU及GPU的AI服务器出货规模将显著增长,实际上今年我们有机会做到更大。”

刘伟称,暴雨国内工厂扩建,包括液冷产线扩建,都在如火如荼地推进,接下来全国还会进行大规模算力基础设施建设。

在算力需求快速扩张的同时,如何管理复杂的算力资源,并以更低的Token成本将AI转化为业务能力,成为需求端的新诉求。

以金融行业为例,当前算力消耗模式已经发生根本性改变。过去,一次请求对应一次推理的短时调用;而随着AI进入业务流程,一个业务流程往往需要多个智能体协同、多轮推理与工具调用,导致Token消耗呈链路级放大且难以预测。

与此同时,金融机构普遍面临多元异构算力资源分散、跨云部署调度难等痛点。一个常见的状况是,总行、分行、研发中心等不同部门各自采购和管理资源,导致一方面部分业务面临算力紧张,而另一方面部分算力资源却处于闲置状态。

“金融机构尤其是从今年开始已经完全意识到了这个问题,不能再让各部门以服务器整机或卡的形式使用算力,而要统一用Token这样的标准化单位,像水电一样来明确计量各个部门需要多少算力资源。”李伟表示。

在这一背景下,暴雨推动“算力Token化”变革,将GPU算力资源抽象为可计量、可调度、可计费的Token,像水电一样按需分配、跨池调度。

李伟介绍,目前头部金融机构已开始探索统一算力调度平台建设,暴雨正在参与相关建设。相比之下,中小金融机构仍处于AI应用初期阶段,更多采用独立部署模式,统一纳管和调度尚需时间推进。

据悉,从经济账来看,算力Token化将帮助实现存量GPU算力利用率提升不低于20%、新购买算力成本节省不低于10%。

http://www.jsqmd.com/news/1080730/

相关文章:

  • 智能改进员中的问题识别与优化实施
  • 【课程设计/毕业设计】基于SpringBoot + 小程序的轻量化旅行记录分享小程序系统的设计与实现 智慧文旅视角下旅游游迹共享服务平台设计与实现【附源码、数据库、万字文档】
  • 高效智能图像去重工具:ImageDedup解决重复图片检测难题
  • 【紧急预警】VMware升级后BIOS兼容性断链!3大主流服务器厂商(HPE/Dell/IBM)固件版本适配清单(限时更新至2024Q3)
  • 返乡创业在顺平:科技小微企业成长折射县域经济转型新活力[转载]
  • 如何用bili2text将B站视频转为文字:3步快速提取视频内容的完整指南
  • 企业微信回调InvalidKeyException排查:EncodingAESKey配置与解密原理详解
  • 2026免费去水印软件哪个好用?电脑手机无广告工具优缺点对比
  • 如何快速掌握知网文献批量下载:面向学术新手的完整解决方案
  • VMware Workstation无法识别CPU虚拟化?BIOS设置3秒速查法(含ASUS/DELL/Lenovo主板快捷键对照表)
  • 5分钟掌握智能钢琴指法:动态规划算法如何革新你的演奏体验
  • 数据驱动LQR中正则化参数效应分析与工程实践指南
  • Python 数据分析实战|2001-2024 全国婚姻登记数据完整挖掘(Pandas+Matplotlib+Pyecharts)
  • 5步解决华硕笔记本性能优化难题:G-Helper完全指南
  • 3个维度探秘:如何打造真正自由的跨平台远程协作体验?
  • 语义搜索实战:稠密检索、重排序与RAG工程落地指南
  • 加权射影空间中行列式簇的度与正则性计算:Macaulay2实战指南
  • 【VMware蓝屏代码速查权威图谱】:覆盖137个常见STOP Code(含Hyper-V嵌套场景特例),2024年Q2最新KB补丁适配清单
  • 2026 年全网数据采集工具选型指南(开源 / 零代码 / 企业 API/RPA 全分类对比)
  • 熵驱动漂移:组合优化算法性能波动的根源与实战应对
  • Spring Boot集成TestNG:构建高效自动化测试的完整指南
  • VMware性能衰减真相曝光(ESXi底层调度机制深度解密)
  • 蓝屏代码不再神秘,VMware虚拟机BSOD错误码全映射表(含vSphere 7.0–8.0内核兼容性矩阵),工程师私藏版首次公开
  • Linux Ubuntu/CentOS虚拟机分辨率异常,强制刷新失败?深度解析vmwgfx驱动机制与xorg.conf黄金配置模板
  • 5分钟快速上手:Figma中文插件让设计工作更高效
  • BilibiliDown:3分钟快速上手!免费开源跨平台B站视频下载器终极指南
  • 【VMware虚拟化故障排查权威指南】:20年老工程师亲授“硬件虚拟化不支持”真相与5步紧急修复法
  • 【限时解锁】VMware启动报错智能诊断矩阵表(含127种错误代码→对应模块→修复命令→验证结果),仅开放48小时下载
  • Go 语言指针最佳实践:从基础到高级应用
  • 全球高校行 | 大树财经携手金色财经、Twinkle,把 Web3 与 AI 带给下一代