当前位置: 首页 > news >正文

AI动态简报之算力基建篇(2026.05.28)

⚡ 第1条:小米MiMo V2.5 API永久降价99%,缓存命中输入每百万Token仅需2.5分钱

核心信息

5月27日零点,小米正式宣布MiMo-V2.5系列API永久降价,最高降幅达99%。雷军同步宣布未来三年将投入600亿元发展AI。此次调价取消上下文窗口长度区分定价,全面优化计费体系。

性能/价格对比

模型

类型

新价格(元/百万Token)

降幅

MiMo-V2.5-Pro

输入(缓存命中)

0.025

↓99%

MiMo-V2.5-Pro

输入(未命中)

3.00

↓79%

MiMo-V2.5-Pro

输出

6.00

↓86%

MiMo-V2.5

输入(缓存命中)

0.020

↓96%

MiMo-V2.5

输入(未命中)

1.00

↓64%

MiMo-V2.5

输出

2.00

↓86%

对开发者/企业的影响

开源模型API价格战全面升级,小米MiMo-V2.5缓存命中输入价格已进入"分厘级别",与DeepSeek形成双雄争霸格局。对于高频调用场景的企业应用,推理成本可降低一个数量级。

信息来源:weste.net / 腾讯新闻 | 2026-05-27


⚡ 第2条:定制ASIC芯片出货增速首次大幅超越GPU,TrendForce预测44.6% vs 16.1%

核心信息

TrendForce最新数据显示,2026年定制AI芯片(ASIC)出货量预计增长44.6%,首次大幅超越通用GPU的16.1%增速,标志着专用硅在AI时代正从"配角"走向"主角"。英伟达虽仍占据70-80%市场份额,但推理侧正被超大规模厂商的自研芯片加速分流。

性能/价格对比

  • Google第七代TPU(Ironwood)被Midjourney采用,月度计算成本从约210万美元降至70万美元,降幅65%
  • Broadcom 2026财年Q1 AI半导体收入84亿美元,同比增长106%,AI积压订单达730亿美元
  • AI专用ASIC收入从2024年约130亿美元,预计2030年超1500亿美元(CAGR≈50%)
  • 2026年基于ASIC的AI服务器出货量占比预计达27.8%,为2023年以来最高

对开发者/企业的影响

企业选择算力基础设施时,评估标准正从"最大吞吐量和带宽"转向"每Token成本、功耗和TCO"。自研ASIC的崛起意味着云服务商可以提供更具性价比的推理服务,但通用GPU在训练市场仍因CUDA生态保持主导。

信息来源:TechTimes / TrendForce | 2026-05-26


⚡ 第3条:华为发表半导体"韬(τ)定律",6年量产381款芯片

核心信息

5月25日,在IEEE国际电路系统研讨会(ISCAS 2026)上,华为董事、半导体业务部总裁何庭波首次发布"韬(τ)定律"——中国在全球半导体领域首个指导产业发展的新原则。过去6年,华为基于该定律已成功设计和量产381款芯片,覆盖千行百业。

性能/价格对比

  • 芯片量产规模:6年内381款,平均每年超63款
  • 华为AI算力目前面临的关键瓶颈:HBM高带宽内存订单排至2027年底,高阶PCB板、MLCC等零部件供应短缺
  • 国产HBM预计2026年底实现小批量供货

对开发者/企业的影响

华为从芯片设计规则制定者角色出发,"韬定律"有望推动国产AI算力全产业链自主化。对于依赖华为算力生态的国内企业,长期来看将获得更稳定的供应链保障和更具性价比的算力选择。

信息来源:腾讯新闻 / IEEE ISCAS 2026 | 2026-05-25


⚡ 第4条:AI推理需求达训练4-5倍,算力租赁价格半年暴涨40%

核心信息

中国证券报报道,2026年AI推理计算需求已全面超越训练需求,达到后者的4-5倍。伴随推理需求爆发,推理算力租赁价格半年内涨幅接近40%,推动算力市场结构发生根本性转变。2026年中国智能算力规模预计达1460.3 EFLOPS,为2024年的两倍。

性能/价格对比

  • 推理算力需求/训练需求:4-5倍
  • 推理算力租赁价格半年涨幅:接近40%
  • 中国智能算力规模:2026年预计1460.3 EFLOPS(2024年的2倍)
  • A股百亿算力订单井喷:东阳光签署160-190亿元算力服务采购框架合同
  • 全球九大云厂商2026年资本支出预估上调至8300亿美元(年增79%)

对开发者/企业的影响

推理成本正成为AI应用落地的核心瓶颈。算力租赁价格的持续上涨意味着,对于不打算自建算力集群的中小企业,选择支持缓存优化的低成本大模型API(如DeepSeek、小米MiMo)成为控制成本的关键策略。

信息来源:IT之家 / 中国证券报 / 新浪财经 | 2026-05-22


⚡ 第5条:DeepSeek-V4-Pro API价格永久降至原价1/4,一个月内第四次调价

核心信息

DeepSeek官方确认,V4-Pro模型API的2.5折优惠将于5月31日结束后永久化,实际收费标准调整为原定价的四分之一。这是DeepSeek一个月内第四次价格调整,持续刷新全球大模型API价格下限。

性能/价格对比

类型

原定价(元/百万Token)

永久新价(元/百万Token)

降幅

输入(缓存命中)

0.1

0.025

75%

输入(缓存未命中)

12

3

75%

输出

24

6

75%

对开发者/企业的影响

DeepSeek与小米MiMo在极低价API赛道形成直接竞争,缓存命中输入价格均已进入"分厘级"。对于大规模部署AI应用的企业而言,DeepSeek V4-Pro配合缓存策略可实现极低推理成本,但对服务质量、响应延迟有更高要求的企业仍需评估综合性能。

信息来源:搜狐 / IT之家 | 2026-05-27

http://www.jsqmd.com/news/907891/

相关文章:

  • 从理想传输线到真实PCB:ADS中微带双枝短截线匹配的完整实战与参数优化
  • C51开发中全局与静态变量初始化问题解析
  • 别再手动写Watermark了!WPF文本框Placeholder的三种主流实现方案(附完整源码)
  • 戴尔笔记本装Ubuntu 20.04,卡在RST技术?别慌,手把手教你安全模式切换AHCI(附详细截图)
  • SAP数据归档实战:除了SARA执行,别忘了SARI信息结构这关键一步
  • HFSS实战:手把手教你用参数扫描和优化功能,搞定2.45GHz矩形贴片天线匹配
  • 微信投票怎么操作,云帆投票(新手实操全流程) - 投票小程序
  • 自主协同AI:从多智能体博弈到系统级涌现行为的技术解析
  • 哪家猎头公司靠谱?2026年5月推荐TOP5对比跨行业急招防错配评测价格注意事项 - 品牌推荐
  • DS-5环境下Arm Linux C/C++项目创建与配置指南
  • 无为市城市绿地系统专项规划(2023-2035年)
  • Keil浮动许可证停留时间优化与配置技巧
  • 大语言模型“合成信服力”的机制、风险与应对策略
  • Oracle数据清洗实战:用正则表达式搞定脏数据(附常用函数速查表)
  • 在Ubuntu 18.04上用Docker Compose一键部署OAI 5G核心网(v1.4.0镜像版)
  • 别再乱装C盘了!保姆级教程:用Unity Hub管理多个Unity版本(含VS2013配置避坑)
  • 从DevOps到LLM Ops:大语言模型应用的生产化运维实践
  • 别只看N5105了!聊聊倍控G30 J4125工控机做All in One主机的真实体验与避坑清单
  • 新手网工别懵圈!华为AC+瘦AP旁挂上线,保姆级配置命令逐行解析
  • Coral NPU:基于RISC-V的开放架构如何重塑边缘AI开发范式
  • WSL2虚拟磁盘迁移后,如何像原来一样丝滑使用?配置默认用户和优化路径的完整指南
  • ADI DSP硬件工程师必看:14针JTAG接口那个被掰断的针脚,到底有什么用?
  • 从校园网到企业网:用Packet Tracer 8.2模拟真实办公网络隔离(VLAN+三层交换实战)
  • 别光看原理了!手把手教你用STM32CubeMX配置PLL,把8MHz晶振超频到72MHz
  • 【juc第三章】:AQS机制全解
  • 大语言模型在糖尿病管理中的应用:架构、场景与挑战
  • 如何用Python快速接入Taotoken并调用多款大模型API
  • 2026年知名的赣州泡沫柱/泡沫垫/泡沫粒/泡沫板实力工厂推荐 - 品牌宣传支持者
  • 保姆级教程:用Docker Buildx搞定ARM和x86镜像,一键推送到自建私有仓库
  • GazeProphet:无硬件依赖的VR注视点预测技术解析