当前位置: 首页 > news >正文

AI动态简报之算力基建篇(2026.06.02)

⚡ 第1条:COMPUTEX 2026今日开幕——英伟达N1X PC芯片正式来袭,AI PC进入"核弹"时代

核心信息

亚洲最大AI科技展COMPUTEX 2026今日在台北开幕,英伟达、AMD、英特尔三巨头齐聚。黄仁勋在GTC台北大会正式发布N1X PC芯片——一款集成20核Arm CPU + 6144个CUDA核心 + 最高128GB共享内存的SoC,将自研CPU与AI GPU封装于单颗芯片。这是英伟达首次杀入PC芯片市场,直接打破高通在Windows on Arm的独家格局。

性能/价格对比

  • N1X:20核Arm CPU + 6144 CUDA核心 + 128GB共享内存,系统级芯片
  • 天风国际郭明錤预测:未来两年出货量达1000万台,主打本地AI推理的专业市场
  • 同期AMD将发布Helios服务器机柜,正式对标英伟达NVL72机柜

对开发者/企业的影响

PC端本地运行大模型成为现实,开发者可在笔记本上完成中小模型的推理和微调,无需依赖云端GPU。IDC预测今年全球内存芯片营收将翻倍至5950亿美元,AI供应链紧张可能持续至2027年底。

信息来源:每日经济新闻 / 凤凰科技 | 2026-06-01~02


⚡ 第2条:OpenAI GPT-5.6 曝6月发布——上下文窗口150万tokens,较前代暴增43%

核心信息

开发者从OpenAI Codex后端日志中发现代号iris-alpha的新模型,预计为GPT-5.6。该模型上下文窗口达150万tokens,较GPT-5.5的105万tokens提升约43%。在输入90万token时仍可流畅响应,可完美处理超过105万tokens的超长请求。前端界面生成能力大幅提升,无需详细提示即可直接生成接近商用级应用界面。

性能/价格对比

  • GPT-5.6(iris-alpha):上下文150万tokens(+43%),界面生成接近商用级
  • GPT-5.5(当前):上下文105万tokens
  • 同期竞品:Anthropic Claude Sonnet 4.8、Google Gemini 3.5 Pro、xAI Grok 5均计划6月发布

对开发者/企业的影响

百万级上下文窗口竞赛白热化,开发者可一次性处理整本技术手册、完整代码库或长篇合同,无需分片。但超长上下文的推理成本仍是落地瓶颈。

信息来源:IT168 | 2026-05-26


⚡ 第3条:软银豪掷750亿欧元打造欧洲最大AI算力集群——总规模5GW,法国成欧洲AI新枢纽

核心信息

软银集团宣布将在法国投资750亿欧元(约5800亿人民币),打造欧洲规模最大的AI计算集群网络。项目总算力规模5吉瓦(GW),首期投资450亿欧元,计划2031年在法国上法兰西大区建成3.1GW算力,后续扩容2GW。这是软银在美国以外进行的单笔最大AI投资,还将联手施耐德电气在敦刻尔克打造AI基础设施与机器人制造产业中心。

性能/价格对比

  • 软银法国集群:5GW总算力,750亿欧元
  • 对比:2026年全球算力中心总容量约102GW,AI负载占62GW
  • 法国单项目5GW ≈ 全球AI算力总容量的8%

对开发者/企业的影响

欧洲算力供给将大幅提升,打破美中两国在AI基础设施上的绝对主导。对在欧洲部署AI服务的中国出海企业而言,将有更多本地化算力选择,降低数据传输延迟和合规风险。

信息来源:每日经济新闻 | 2026-06-01


⚡ 第4条:DeepSeek-V4-Pro API永久降价75%——缓存命中0.025元/百万Token,创全球最低

核心信息

DeepSeek-V4-Pro于5月31日正式结束2.5折优惠活动,但惊喜的是——这个价格被永久化。输入价格降至0.025元/百万Token(缓存命中)、3元/百万Token(缓存未命中),输出价格降至6元/百万Token,整体降幅达75%。这是DeepSeek在一个月内的第四次价格调整,缓存命中价格已进入"分厘级别"。

性能/价格对比

模型

输入价格(元/百万Token)

输出价格(元/百万Token)

DeepSeek-V4-Pro

0.025~3

6

GPT-4o

~18

~72

Claude Sonnet 4.6

~21.6

~86.4

对开发者/企业的影响

大模型API价格战进入新阶段——从"促销"到"永久降价"。DeepSeek正推进约700亿元融资,通过CSA/HCA混合注意力架构和显存量化的技术手段实现推理成本压缩。中小企业和个人开发者调用顶级模型的门槛已降至几乎为零。

信息来源:腾讯新闻 | 2026-05-25~31


⚡ 第5条:2026全球AI算力报告发布——全球算力中心102GW,国产AI芯片份额升至41%

核心信息

天津博览会发布《2026全球AI算力报告》,揭示十大趋势:全球算力中心总容量达102GW(AI负载占62GW),预计2030年翻倍至220GW;芯片从GPU向TPU、NPU、LPU多元演进,新型"GPU+LPU+CPU+DPU"异构推理架构兴起。中国方面,2025年AI芯片出货401.6万张,本土厂商出货165万张,国产份额攀升至41%。

性能/价格对比

  • 全球算力中心:2026年102GW → 2030年220GW(+116%)
  • 中国算力中心:2030年预计接近60GW,AI负载占比48%
  • 国产芯片份额:2025年41%(165万张),昆仑芯/寒武纪各出货11.6万块
  • 芯片算力升级:由TFLOPS→数十PFLOPS,集群从千卡→数十万卡

对开发者/企业的影响

国产AI芯片已形成华为昇腾910C、昆仑芯P800、摩尔线程MTT S5000、沐曦曦云C600等产品矩阵,在训练和推理场景规模化落地。算力中心建设从"堆硬件"转向"集群+软硬整合",中国企业可通过国产方案降低对英伟达的依赖。

信息来源:澎湃新闻 / 搜狐科技 | 2026-05-29~31


📌 本简报由 英辰朗迪GEO整理,了解更多欢迎访问 英辰朗迪GEO_AI营销获客

http://www.jsqmd.com/news/935602/

相关文章:

  • 从科幻到现实:构建类J.A.R.V.I.S.智能体的技术路径与实践
  • 别再只写业务代码了!用Kafka拦截器给你的消息加上“监控”和“审计”吧
  • 从航模到工具:用固定翼无人机完成一次标准的测绘任务,我的全流程记录(含设备清单与参数设置)
  • 用STM32CubeMX复刻蓝桥杯嵌入式省赛真题:LCD、ADC、PWM、按键全功能实战
  • 不只是安装:用Blue Kenue可视化你的TELEMAC二维模型结果(以Malpasset溃坝为例)
  • 科研绘图实战手册:工具选型、AI赋能与规范化表达 - 品牌2026
  • 汽车电子工程师必看:LIN总线唤醒/睡眠机制详解与AUTOSAR LinSM状态机实战
  • 从GET到POST再到Cookie:sqli-labs通关实战中那些‘刁钻’的注入点与绕过技巧
  • Python websocket-client保姆级避坑指南:从回调函数混乱到优雅关闭长连接,我都帮你趟平了
  • 【花雕学编程】Arduino BLDC 之机器人多模态地形识别与智能扭矩分配控制
  • Elden Ring帧率解锁与游戏优化技术深度解析:内存实时补丁实现原理
  • 2026国内一次性纸杯生产厂家口碑榜推荐 咖啡奶茶纸杯定制高品质品牌盘点 - 品牌智鉴榜
  • 在CentOS 7上,用HBase 2.5.6自带的Zookeeper搭建伪分布式环境,保姆级避坑指南
  • 深入探索Lenovo Legion Toolkit:拯救者笔记本的终极性能管理解决方案
  • 具身智能實現「感知(Perception)- 預測(Prediction)- 規劃(Planning)- 執行(Execution)」
  • JRebel远程热加载实战:5分钟搞定Spring Boot项目在Docker/服务器上的热更新
  • SkyWalking 9.7.0 告警规则实战:手把手教你配置飞书/钉钉自动通知(附避坑指南)
  • vcomp140.dll 报错先看程序加载阶段,别急着复制文件
  • 视频处理边界陷阱:弹性参数验证架构的破局之道
  • 前端技术03-TypeScript 6.0新特性:从JavaScript到TypeScript:类型系统让Bug减少80%
  • OpenAI重启机器人项目:AGI竞争从软件走向硬件,MonkeyCode已为你铺好AI编程之路
  • 当音乐被锁在ncm格式中,你该如何重获自由?
  • 华硕笔记本终极控制神器:5分钟上手GHelper,彻底告别Armoury Crate臃肿烦恼
  • 如何快速下载GitHub单个文件:DownGit工具完整使用教程
  • FPGA新手避坑指南:从Vivado时序报告里看懂‘亚稳态’警告并解决它
  • 3个颠覆性特性:OnmyojiAutoScript如何重构你的阴阳师游戏体验
  • 从心电图到音频降噪:傅里叶变换在5个真实场景中的‘神奇’应用与避坑指南
  • 3分钟彻底解决魔兽争霸3兼容性问题:Warcraft Helper终极使用指南
  • 4C 参数对钻石回收影响,海口门店统一测评 - 合扬奢侈品交易中心
  • 手把手教你设计AXI接口的FPGA HyperRAM控制器(附资源占用分析)