当前位置: 首页 > news >正文

AI动态简报之算力基建篇(2026.06.03)


⚡ 第1条:NVIDIA发布RTX Spark超级芯片——个人AI计算机迈入"千万亿次"时代

核心信息

COMPUTEX 2026首日,NVIDIA正式发布RTX Spark超级芯片,将Blackwell架构GPU与20核Grace CPU通过NVLink-C2C融合为统一芯片。该芯片配备6144个CUDA核心、第五代Tensor Core(支持FP4精度),最高可搭载128GB统一内存,AI算力达1 Petaflop(千万亿次浮点运算/秒)。

性能指标

参数

RTX Spark

AI算力

1 Petaflop

CUDA核心

6144个

CPU

20核Arm(联发科定制)

统一内存

最高128GB

本地运行大模型

1200亿参数/100万token上下文

上市时间

2026年秋季(华硕/戴尔/联想/微软Surface首发)

对开发者/企业的影响

单机即可本地运行千亿参数大模型,彻底打破"跑大模型必须上云"的壁垒。超过100家Windows软件商(含Adobe、Blackmagic Design)已启动适配,AI PC生态进入爆发前夜。

信息来源:腾讯新闻 | 2026-06-02


⚡ 第2条:黄仁勋预言Marvell成"万亿公司",高速互联成AI算力新主线

核心信息

COMPUTEX 2026次日,英伟达CEO黄仁勋与Marvell CEO Matt Murphy同台对谈。黄仁勋指出,随着Agent AI大规模落地,AI计算正从"单GPU竞赛"进入"数据中心协同计算"时代——高速互联、交换芯片、光通信的重要性正快速超越GPU本身。他公开称Marvell可能成为"下一家万亿美元公司"。

股价表现

标的

表现

Marvell (MRVL)

前日涨超7%,夜盘一度暴涨12%+

英伟达 (NVDA)

领涨科技股,美股再创新高

对开发者/企业的影响

AI基础设施投资逻辑正在转向——CPO(共封装光学)、midplane互联、800V DC电源等"连接层"技术将成为下一轮算力基建的核心标的。数据中心从"买更多GPU"变为"建更高效的互联网络"。

信息来源:新浪财经 | 2026-06-02


⚡ 第3条:2026全球AI算力报告发布:全球102GW,2030年翻倍至220GW

核心信息

5月29日天津世界智能产业博览会上,《2026全球AI算力发展研究报告》重磅发布。报告指出:全球算力中心总容量达102GW(其中AI负载62GW),预计2030年翻倍至220GW(AI负载占71%)。AI芯片正从GPU向TPU、NPU多元演进,算力中心迈入吉瓦级超大规模绿色集群阶段。

关键数据

指标

2026年

2030年(预测)

全球算力中心总容量

102GW

220GW

AI负载占比

61%

71%

美国年耗电量

292TWh

606TWh(占全美11%)

中国算力中心容量

接近60GW(AI占48%)

全球耗电量

415TWh(2024)

945TWh(年均增15%)

十大趋势方向:算力架构升级、多智能体推理需求爆发、能源供给变革(风光储→核能→氢能)、太空算力、词元经济学等。

信息来源:CSDN / 智东西 | 2026-06-01


⚡ 第4条:中国移动19亿服务器大单落定,国产ARM算力加速崛起

核心信息

中国移动2026-2027年PC服务器集采结果公布,武汉长江计算独揽全部4个ARM架构标包,税前中标金额超19亿元。截至2026年3月底,我国智能算力规模达每秒1882百亿亿次,但当前训练算力仍占70-80%,未来推理算力预计将占70%以上。

产业链景气验证

公司

算力相关采购/合同金额

东阳光

160亿-190亿元

华策影视

不超过33亿元

盛视科技

约60亿元

杰创智能

约3.6亿元

74只算力概念股年内平均涨幅接近43%,融资余额较去年末增加近35%。

对开发者/企业的影响

运营商级ARM服务器大规模采购标志着国产ARM生态从"可用"迈向"好用",华为昇腾、昆仑芯等国产AI芯片的配套服务器部署有望加速。

信息来源:新浪财经 | 2026-06-02


⚡ 第5条:小米MiMo-V2.5 API最高降99%,大模型价格战进入"分时代"

核心信息

5月27日,小米宣布MiMo-V2.5系列API永久降价,最高降幅达99%。MiMo-V2.5-Pro缓存命中仅0.025元/百万tokens,标准版更是低至0.02元。同时取消上下文窗口分级定价,Token Plan套餐Token用量提升5-8倍。这是继DeepSeek-V4-Pro永久降价75%后,又一家头部厂商加入价格战。

价格对比

模型

缓存命中(元/百万tokens)

输入(元/百万tokens)

输出(元/百万tokens)

MiMo-V2.5-Pro

0.025

3

6

MiMo-V2.5标准

0.020

1

2

DeepSeek-V4-Pro

0.025

3

6

对开发者/企业的影响

大模型API已从"元时代"进入"分时代",中小企业AI应用开发成本大幅降低。但需注意:MiMo-V2-Pro和Omni系列维持原价未参与降价,厂商通过价格分层引导开发者迁移至最新架构。

信息来源:新浪科技 / ITBear | 2026-05-27


📌 本简报由 英辰朗迪GEO整理

http://www.jsqmd.com/news/944075/

相关文章:

  • Win11任务栏改造心得:我是如何用一杯咖啡钱的StartAllBack,既保留新开始菜单又找回经典任务栏的
  • 孤舟笔记 分布式与微服务篇九 什么是幂等性?为什么面试总问它?解决思路一次讲透
  • 智能任务调度系统设计白皮书(2024企业级AI Ops标准草案首次公开)
  • 山西省中级经济师工商管理/人力资源管理:适配人群、岗位匹配与备考全攻略 - 众智商学院课程中心
  • STM32F103C8T6正交编码器角度采集工程:AB相计数+Z相归零,支持360°整圈映射与多线数适配
  • 2026海南高新技术企业认定代办机构排名|靠谱高企注册流程代办公司推荐 - GrowthUME
  • 微积分(十二)——多元微积分:高维空间中的变化
  • 游戏AI工具链整合失败率高达68%?2024Q2行业审计报告揭示:缺失这4个契约式接口定义是主因
  • 如何用LeagueAkari高效管理英雄联盟游戏体验:免费开源工具箱完全指南
  • Arduino与DS18B20温度传感器实战:从单总线协议到多点监测
  • 小白也能学会!我的AI大模型工程师独家学习路线,收藏起来直接抄作业!
  • XMly-Downloader-Qt5开源工具:跨平台音频下载方案与Qt5界面优化技巧
  • 【ESP32-S3 从入门到精通-06】2026 最新 Wi-Fi 网络开发与配网技术全实战(Station/AP/TCP/UDP/SmartConfig)
  • 圣擎航空深耕非洲航线机票服务助力企业高效通达非洲核心城市 - 土星买买买
  • 安庆装修公司哪家靠谱?2026专业推荐让你放心选择 - 企业品牌
  • mg3680,mg3650,ts3440,g3800,ts3800,ts9020,ts8180报错5B00,P07,E08,5b02,1704,1700,5b04佳能V6.200,亲测有用。
  • 长春到天津物流专线公司有保险吗?真实理赔数据告诉你答案
  • Nintendo Switch Cleaner and Builder:Switch游戏文件管理的专业一站式解决方案
  • 如何5分钟快速掌握AsrTools:智能语音转文字的终极指南
  • Ai2Psd终极指南:如何实现Illustrator到Photoshop的无损矢量图层转换
  • 国产之光 DeepSeek 把 AI 大佬全炸出来了,对 AI 行业竞争格局有何影响?
  • 实战指南:如何高效应用15MW海上风力涡轮机开源仿真模型
  • MATLAB脑网络分析专用BCT工具包,支持功能/结构连接矩阵全流程计算
  • 从落地视角拆解企业Agent三层落地骨架
  • 2026海南注册公司+进出口权备案一站式代办,哪家财税机构亲测真实安心选? - GrowthUME
  • 【私密内参】AI社交中枢搭建手册:零代码接入微信/飞书/WhatsApp+AI意图识别引擎(限首批200份技术蓝图)
  • Deep Agents SubAgent Async SubAgent
  • Codex 新升级彻底打通 Windows 生态手机也能远程跑开发任务效率拉满
  • 魔兽争霸3终极优化指南:如何让经典游戏在现代电脑上完美运行
  • Simplygon 4.x x86开发套件:Windows平台3D模型自动简化工具包,含运行库、GUI/CLI示例与完整API文档