当前位置: 首页 > news >正文

智博会上的国产芯:重新定义 Token 价值链路

AI 时代,算力是核心引擎,Token 是信息处理的最小单元,两者都是智能化产线上的「硬通货」。然而,近年来算力新基建持续提速,Token 调用量爆发式增长,真实业务场景中的价值产出却未能有效同步,业界情绪开始从「算力不足恐惧症」转向「Token 焦虑」。

天津智博会上,海光信息总裁助理兼智能计算产品部总经理杜夏威指出,「过去大家谈算力,比的是单卡峰值;现在谈 Token,比的是单位产出。」在他身后,海光展台上全系 CPU 和 DCU 产品一字排开,从通用计算到 AI 加速,从数据中心到边缘工控,几乎覆盖了 Token 效益产出的每一个环节。


Token 焦虑,本质是算力到生产力的转化效率问题

「Token 焦虑未必是坏事。如果大家对算力和大模型没有感知,自然不会焦虑。焦虑说明产业在快速流动。」杜夏威对 Token 热的判断有些出人意料。

他认为,Token 的出现本身就是一个进步——它把算力和算法之间的度量衡统一了。「以前你说算力有多强,用户听不懂。现在你说一个 Token 多少钱、响应多快,所有人都能算账。」

但这个统一的度量衡也暴露了问题:算力指标和 Token 吞吐力之间,存在一条不小的鸿沟。杜夏威打了个比方:「芯片算力是物理天花板,决定了上限;Token 吞吐力是转化效率,决定了用户实际能用到多少。」

海光过去几年做的事,可以理解为逐级搭建价值转化阶梯:算力性能-适配效率-模型效率-Token 效率。每一步都有具体动作——400 多款主流大模型做到了 Day0 适配,自研 DTK 软件栈让 CUDA 代码平滑迁移,DCU 在多个模型推理场景下的首 Token 延迟做到低于 NVIDIA H20。

杜夏威指出,「训练看集群效率,推理看单位成本」正在成为行业共识。在计算集群方面,算力精度不足导致的应用能效下降,甚至场景覆盖不足等问题颇为显见,超智融合成为提升 Token 效益的重要途径。

为此,海光基于 DCU 全精度计算能力,已支撑多个万卡级超智融合智算集群成功落地,并且广泛覆盖了万亿参数模型训练、AI4S、AI4E 等前沿场景需求。

除此之外,海光 DCU 在推理场景的优化已经深入到算子层——Attention 算子融合、KV Cache 压缩管理、FP8/INT4 低精度支持,目的是让客户「训得起,也推得起」。


CPU 被低估了:它是 Token 经济的「中枢大脑」

智博会现场,另一个被反复讨论的话题是 CPU 在 AI 时代的新角色。

「过去在 AI 训练阶段,Token 或者说 CPU 的性能并没有充分体现。」海光信息总裁助理、创新产品线总经理李成指出,随着 OpenClaw 等智能体(Agent)爆发,CPU 的重要性正在回归。因为 Agent 不是简单问答,而是「长在线、高交互」——持续运行、调用工具、访问记忆、执行任务。

有研究显示,在智能体工作负载中,CPU 端的处理延迟占比最高可达 90% 以上。GPU 负责「算得快」,CPU 负责「跑得久、调度稳」。如果 CPU 扛不住,GPU 再强也只能空转。这是 Token 价值产出的又一个关键环节。

「大模型参数量越来越大,MoE(混合专家)成为主流结构,我们不得不将 KV Cache 和部分算力 offload 到 CPU 端。」杜夏威补充道,「这导致即便在数据中心内部,CPU 和 GPU 的耦合也越来越紧,CPU 的作用只会越来越大」。

海光 C86 系列 CPU 恰好卡位在这个趋势上。其原生兼容 x86 生态,端侧和边缘场景表现出色,同时从指令集层面内置了国密算法和可信计算能力,对熔断、幽灵等漏洞原生免疫。用杜夏威的话说:「算力底座稳了,上层 Token 产出才稳得住、跑得快。」


端侧算力崛起:AI 落地的「最后一公里」

AI 的下一步,不能只靠数据中心。尤其在现实生产场景中,Token 不会永远飘在云端,工厂产线、变配电站、交通路口,数据实时处理必须在现场完成,端侧算力成为快速响应的关键。

光合组织嵌入式产品专家张考华在采访中指出,「AI 这场大戏,数据中心训练只是开场。未来能发展多深、影响多广,要看边端。」他判断,边端算力需求必将迎来爆发式增长。

端侧场景已经铺开。从智能制造、能源电力到机器人,边缘侧对高可靠、低延迟 AI 算力的需求正在激增。张考华特别提到一个趋势:「算力上天」——星际探索中很多算力不需要传回地面,「边缘侧算力和 Token 引流的意义,远超大多数人想象」。

海光与光合组织的打法是「云边协同」:通过云上算力网络服务中小企业和个人开发者,同时提供私有化算力方案,让对数据安全敏感的行业用户可以在本地完成 AI 转型。

「云端提供便捷 Token 服务,私域沉淀数据资产、做深度业务整合。」张考华说,两种模式互为补充,共同覆盖了从消费端到产业端的全场景算力需求。

在双芯产品阵列中,海光这次专门展出了工控和嵌入式芯片解决方案。据介绍,这款芯片继承了 C86 架构的技术积累,宽温支持、工业可靠性、内生安全等方面均做了针对性设计,在很多边端实测场景中打破了国产工控芯片「能用但不好用」的印象。

从数据中心到边缘节点,国产芯片展现的能力版图已经清晰:不止是在单一维度上比拼参数,而是用一套覆盖「端、边、云」的算力协同体系,系统性解决 Token 从生产到变现的堵点。


我是木易,Top2 + 美国 Top10 CS 硕,现在是 AI 产品经理。

关注「AI信息Gap」,让 AI 成为你的外挂。


http://www.jsqmd.com/news/915957/

相关文章:

  • Claude vs GPT-4 Turbo vs Gemini 1.5 Pro:横向压测12项任务,成本效率比值首次权威发布
  • 灰度信托溢价套利机制与加密市场资金流动分析
  • 人形机器人Figure 01技术解析:多模态AI如何驱动未来人机协作
  • 其利天下圆满完成第二十届深圳国际金融博览会参展之行
  • 从Dropout到残差连接:实战中如何为你的基因预测模型选择正则化与防梯度消失策略
  • 2026年佛山市CPPM报名十大核心问题全流程答疑 - 众智商学院课程中心
  • 好用的网络投票平台推荐|2026实测口碑实用款 - 微信投票小程序
  • 洛谷P3366 【模板】最小生成树题解
  • C语言字符串格式化输出:%s精度控制与安全实践
  • EliSpot 技术:疫苗研发不可或缺的核心工具
  • TegraRcmGUI深度解析:Switch注入工具的三大核心原理与实战验证指南
  • 上海湘峰图文制作:普陀上海企业文化墙制作公司有哪些 - LYL仔仔
  • 从标准库到HAL库:一个STM32初学者的真实踩坑与避坑指南(附江科协视频推荐)
  • 2026年国内水晶装饰建材采购指南:隔音玻璃砖与热熔艺术水晶砖深度评测 | K9高透水晶砖水晶柱装饰水晶挂片背景墙工程水晶定制源头工厂全国服务 - 企业品牌优选推荐官
  • 基于边缘计算与Bun运行时构建高性能新闻聚合系统架构实践
  • 北京金发钹祥金属材料贸易:靠谱的北京不锈钢焊接公司 - LYL仔仔
  • WorkshopDL终极指南:无需Steam客户端下载创意工坊资源的完整方案
  • 告别卡顿!Unity 2020.3 LTS安卓高刷屏适配指南:从Activity入手搞定帧率与刷新率同步
  • 乌鲁木齐黄金上门回收平台对比2026 - 黄金回收
  • 《B4500 [GESP202603 三级] 凯撒密码》
  • 别再乱拖控件了!VisionPro 9.0项目维护指南:用CogToolBlock和C#脚本让算法结构更清晰
  • 区块链与第四次工业革命融合:构建可信数据协作新范式
  • Kubernetes 控制器(Controller)详解【20260530】001篇
  • 2026年济南市CPPM报名十大核心问题全流程答疑 - 众智商学院课程中心
  • 2026年厦门市CPPM报名十大核心问题全流程答疑 - 众智商学院课程中心
  • 2026四川文化艺术学院报考指南:哪些专业就业率高? - 品牌2025
  • Web3技术路线之争:从不可能三角到应用范式,开发者如何选择?
  • 2026年4月中封袋生产商推荐,聚酯尼龙袋/包装袋/中封袋/八边封包装袋/三边封包装袋,中封袋订做厂家口碑推荐 - 品牌推荐师
  • 手把手教你用ntdsutil命令,把辅域控扶正成主域控(Windows Server 2022实战)
  • OEXN平台:信息披露与运营规范性的评测参考