当前位置: 首页 > news >正文

云工场科技推进CPU+GPU协同推理,推动大模型应用降本增效

随着大模型应用从训练走向规模化推理,算力供给正在面临新的结构性挑战。

一方面,高性能 GPU 资源持续紧张,推理调用成本居高不下;另一方面,大量存量 CPU 服务器在传统通算场景之外,仍有进一步释放价值的空间。如何让通用计算资源与智能计算资源形成协同,成为提升大模型推理效率、降低应用成本的重要方向。

围绕这一趋势,云工场科技正在推进“面向大模型推理的通算智算融合调度与协同推理平台”相关研究与建设。

平台依托云工场现有边缘云与智算基础设施,将 CPU 通用计算资源、英伟达 GPU、AMD GPU、国产 GPU 等多架构资源纳入统一资源池,探索面向大模型推理场景的异构算力协同调度能力。

该平台的核心思路,是让 CPU 不再仅作为传统通用计算资源,而是参与到 AI 推理服务链路之中。

在大模型推理过程中,CPU 可承担请求接入、任务队列、数据预处理、上下文管理、KV Cache 管理、服务编排、轻量推理、Token 计量等环节;GPU 则重点承担大参数模型计算、高并发矩阵运算等核心推理任务。通过“CPU 负责组织与辅助计算、GPU 负责核心推理计算”的协同架构,平台有望提升整体资源利用效率,缓解单一 GPU 推理模式下的资源压力。

与传统 GPU 推理服务不同,云工场科技此次研究的重点不只是资源层面的统一纳管,而是围绕推理链路进行协同优化。平台将根据模型规模、并发请求、响应时延和成本目标,动态匹配 CPU、GPU 或 CPU+GPU 协同执行方式,推动通算资源与智算资源在实际业务场景中的融合使用。

在应用方向上,该成果可面向政务问答、企业知识库、智能客服、办公助手、内容生成、行业模型推理、中小企业 AI 应用开发等场景。通过 CPU+GPU 协同推理,平台可在保障推理服务稳定性的基础上,进一步提升存量 CPU 服务器的 AI 化利用效率,释放 GPU 核心计算能力,并为政府、园区、企业、开发者和 ISV 提供更加弹性、普惠、可持续的大模型推理服务。

后续,云工场科技将按照“资源接入—链路拆解—协同调度—场景验证—规模应用”的路径持续推进相关能力建设,并结合裸金属、容器云、弹性算力、模型服务、API 调用、Token 计量等产品形态,逐步形成面向城市级 AI 应用场景的通算智算融合推理服务体系。通过持续推进 CPU+GPU 协同推理研究,云工场科技将进一步探索存量算力资源盘活、高端 GPU 资源优化使用以及大模型应用成本下降的可行路径,为 AI 应用规模化落地提供更加坚实的算力支撑。

http://www.jsqmd.com/news/886851/

相关文章:

  • 2026闭眼入!5款AI写作辅助软件亲测,告别卡壳症,初稿思路秒打通!
  • 2026年5月A2级铝复合板厂家推荐:TOP5排名幕墙防火评测专业价格 - 品牌推荐
  • Awoo Installer终极指南:快速免费安装Switch游戏的完整解决方案
  • 废标只在一瞬间:2026年主流AI标书工具实测,教你怎么选?
  • GEO不是一个岗位,是一套组织能力:2026年企业GEO落地的组织架构设计
  • 多保真度机器学习势函数:融合自旋极化与高精度数据提升催化模拟
  • 2026年5月防火铝塑板厂家推荐:TOP5排名选择指南专业评测价格 - 品牌推荐
  • 告别手动循环!用ABAP LOOP GROUP BY新语法重构你的报表代码(附3个实战案例)
  • 将Hermes Agent智能体工具对接至Taotoken的配置要点
  • 2026年5月金属复合板厂家推荐:十大排名工程幕墙防变形评测专业价格 - 品牌推荐
  • 2026年AI驱动企业财务费控平台深度选型指南
  • 电容损坏深度诊断,从外观到 ESR精准区分容衰与漏电
  • sudo高频指令【20260525】002篇-Linux sudo指令速查表
  • Windows热键侦探:3分钟揪出占用你快捷键的“元凶“
  • 5分钟快速上手:免费网页版三国杀无名杀终极指南
  • 2026大模型Agent面试全攻略
  • steam/csgo搬砖市场还要跌多久?纪念品炼金更新又添一把火?
  • 2026年扫描电子显微镜选型指南:易姆科特的核心优势与产品矩阵解析
  • 抖音批量下载神器:douyin-downloader 免费工具全攻略
  • GEO优化踩过的8个坑:2026年最常见的误区与避坑指南
  • 通过用量看板清晰掌握团队每月大模型API成本消耗
  • 2026年GEO工具选型终极指南:5大主流平台深度拆解,到底该选谁?
  • 半导体元件(二极管/三极管/MOS管/IC)损坏诊断全解
  • 172号卡平台官方推荐码怎么选?填错了,少赚好几万! - 172号卡
  • 告别玄学:手把手调试UEFI PCIe枚举,用QEMU+EDK2亲眼看看BusNumber分配全过程
  • sudo高频指令【20260525】003篇-Linux sudo指令速查表
  • PCB虚焊/走线断裂/焊盘脱落工程师易漏判
  • 2026年高分辨率扫描电镜品牌对比:航空航天与半导体研发场景选购指南
  • 哪家金属复合板厂家靠谱?2026年5月推荐十大对比建筑外墙防褪色评测特点选择指南 - 品牌推荐
  • 【AI 自动化工具 】OpenClaw 快速部署指南(包含安装包)