当前位置：首页 > news >正文

AI动态简报之算力基建篇（2026.06.02）

news 2026/7/24 17:50:41

⚡ 第1条：COMPUTEX 2026今日开幕——英伟达N1X PC芯片正式来袭，AI PC进入"核弹"时代

核心信息：

亚洲最大AI科技展COMPUTEX 2026今日在台北开幕，英伟达、AMD、英特尔三巨头齐聚。黄仁勋在GTC台北大会正式发布N1X PC芯片——一款集成20核Arm CPU + 6144个CUDA核心 + 最高128GB共享内存的SoC，将自研CPU与AI GPU封装于单颗芯片。这是英伟达首次杀入PC芯片市场，直接打破高通在Windows on Arm的独家格局。

性能/价格对比：

N1X：20核Arm CPU + 6144 CUDA核心 + 128GB共享内存，系统级芯片
天风国际郭明錤预测：未来两年出货量达1000万台，主打本地AI推理的专业市场
同期AMD将发布Helios服务器机柜，正式对标英伟达NVL72机柜

对开发者/企业的影响：

PC端本地运行大模型成为现实，开发者可在笔记本上完成中小模型的推理和微调，无需依赖云端GPU。IDC预测今年全球内存芯片营收将翻倍至5950亿美元，AI供应链紧张可能持续至2027年底。

信息来源：每日经济新闻 / 凤凰科技 | 2026-06-01~02

⚡ 第2条：OpenAI GPT-5.6 曝6月发布——上下文窗口150万tokens，较前代暴增43%

核心信息：

开发者从OpenAI Codex后端日志中发现代号iris-alpha的新模型，预计为GPT-5.6。该模型上下文窗口达150万tokens，较GPT-5.5的105万tokens提升约43%。在输入90万token时仍可流畅响应，可完美处理超过105万tokens的超长请求。前端界面生成能力大幅提升，无需详细提示即可直接生成接近商用级应用界面。

性能/价格对比：

GPT-5.6（iris-alpha）：上下文150万tokens（+43%），界面生成接近商用级
GPT-5.5（当前）：上下文105万tokens
同期竞品：Anthropic Claude Sonnet 4.8、Google Gemini 3.5 Pro、xAI Grok 5均计划6月发布

对开发者/企业的影响：

百万级上下文窗口竞赛白热化，开发者可一次性处理整本技术手册、完整代码库或长篇合同，无需分片。但超长上下文的推理成本仍是落地瓶颈。

信息来源：IT168 | 2026-05-26

⚡ 第3条：软银豪掷750亿欧元打造欧洲最大AI算力集群——总规模5GW，法国成欧洲AI新枢纽

核心信息：

软银集团宣布将在法国投资750亿欧元（约5800亿人民币），打造欧洲规模最大的AI计算集群网络。项目总算力规模5吉瓦（GW），首期投资450亿欧元，计划2031年在法国上法兰西大区建成3.1GW算力，后续扩容2GW。这是软银在美国以外进行的单笔最大AI投资，还将联手施耐德电气在敦刻尔克打造AI基础设施与机器人制造产业中心。

性能/价格对比：

软银法国集群：5GW总算力，750亿欧元
对比：2026年全球算力中心总容量约102GW，AI负载占62GW
法国单项目5GW ≈ 全球AI算力总容量的8%

对开发者/企业的影响：

欧洲算力供给将大幅提升，打破美中两国在AI基础设施上的绝对主导。对在欧洲部署AI服务的中国出海企业而言，将有更多本地化算力选择，降低数据传输延迟和合规风险。

信息来源：每日经济新闻 | 2026-06-01

⚡ 第4条：DeepSeek-V4-Pro API永久降价75%——缓存命中0.025元/百万Token，创全球最低

核心信息：

DeepSeek-V4-Pro于5月31日正式结束2.5折优惠活动，但惊喜的是——这个价格被永久化。输入价格降至0.025元/百万Token（缓存命中）、3元/百万Token（缓存未命中），输出价格降至6元/百万Token，整体降幅达75%。这是DeepSeek在一个月内的第四次价格调整，缓存命中价格已进入"分厘级别"。

性能/价格对比：

模型	输入价格（元/百万Token）	输出价格（元/百万Token）
DeepSeek-V4-Pro	0.025~3	6
GPT-4o	~18	~72
Claude Sonnet 4.6	~21.6	~86.4

对开发者/企业的影响：

大模型API价格战进入新阶段——从"促销"到"永久降价"。DeepSeek正推进约700亿元融资，通过CSA/HCA混合注意力架构和显存量化的技术手段实现推理成本压缩。中小企业和个人开发者调用顶级模型的门槛已降至几乎为零。

信息来源：腾讯新闻 | 2026-05-25~31

⚡ 第5条：2026全球AI算力报告发布——全球算力中心102GW，国产AI芯片份额升至41%

核心信息：

天津博览会发布《2026全球AI算力报告》，揭示十大趋势：全球算力中心总容量达102GW（AI负载占62GW），预计2030年翻倍至220GW；芯片从GPU向TPU、NPU、LPU多元演进，新型"GPU+LPU+CPU+DPU"异构推理架构兴起。中国方面，2025年AI芯片出货401.6万张，本土厂商出货165万张，国产份额攀升至41%。

性能/价格对比：