当前位置: 首页 > news >正文

AI动态简报之算力基建篇(2026.06.25)


⚡ 第1条:OpenAI 首款自研 AI 芯片"Jalapeno"横空出世,联手博通九个月完成流片

核心信息

北京时间 2026 年 6 月 25 日,OpenAI 正式对外发布其首款自研 AI 推理芯片,命名为 Jalapeño(哈拉贝诺辣椒)。该芯片由 OpenAI 与半导体巨头博通(Broadcom)联合开发,专为大语言模型推理场景设计,从设计到流片仅用时九个月,创下行业纪录。

性能/价格对比

  • 定位:推理专用芯片,非训练芯片,主打高性价比推理部署
  • 合作模式:OpenAI 提供架构设计,博通负责物理实现与量产
  • 战略意义:OpenAI 从此摆脱对英伟达 GPU 的单一依赖,推理成本有望大幅下降

对开发者/企业的影响

OpenAI 自研芯片量产后,API 推理成本有望进一步降低,开发者的调用费用可能迎来新一轮下调;同时也标志着 AI 巨头向上游芯片环节延伸成为行业新趋势。

信息来源:Weste.net | 2026-06-25


⚡ 第2条:英伟达 Blackwell Ultra 发布,FP8 算力高达 20 petaFLOPS

核心信息

2026 年 6 月 1 日,英伟达 CEO 黄仁勋在台北国际电脑展上揭晓新一代 AI 芯片 Blackwell Ultra,FP8 算力高达 20 petaFLOPS,较上一代 Blackwell 芯片实现显著性能跃升,AI 基础设施进入全新算力量级。

性能/价格对比

  • FP8 算力:20 petaFLOPS(Blackwell Ultra)vs 上代 Blackwell 约 10-14 petaFLOPS
  • 内存:搭载 HBM3e 最高 288GB,带宽超过 8 TB/s
  • 系统级:GB300 NVL72 机架方案可提供超过 1 ExaFLOP 的 FP4 推理算力

对开发者/企业的影响

Blackwell Ultra 的量产将大幅提升大模型训练与推理效率,单位算力成本持续下降;云服务商将在 2026 年下半年开始规模部署,开发者可期待更快的 API 响应速度和更低的延迟。

信息来源:Raybyte.cn | 2026-06-02


⚡ 第3条:AI 大模型"超级 6 月":GPT-5.6、Claude Opus 4.8、Gemini 3.5 扎堆发布

核心信息

2026 年 6 月,全球 AI 大模型赛道迎来史无前例的密集发布潮。Anthropic 发布 Claude Fable 5(即 Claude Opus 4.8),谷歌推出 DiffusionGemma,月之暗面更新 Kimi K2.7 Code,智谱发布 GLM-5.2,微软更是一次性发布七款自研 MAI 系列模型(从 170 亿参数到 1.8 万亿参数 MoE 架构),标志着大模型竞争从"单点突破"进入"生态集群"较量阶段。

性能/价格对比

  • 微软 MAI-Orion:1.8 万亿参数 MoE 架构,直接对标 GPT-5 级别
  • 微软 MAI-Mini:170 亿参数,面向端侧部署,可在手机运行
  • Claude Opus 4.8:推理能力大幅提升,代码生成准确率创新高
  • 本月发布/更新的主流模型数量超过 10 款,创历史纪录

对开发者/企业的影响

模型选择空前丰富,开发者可根据场景选择性价比最优的模型;竞争加剧也将推动各大厂商 API 价格持续下行,企业 AI 应用落地成本将进一步降低。

信息来源:搜狐科技 / 掘金 | 2026-06-14


⚡ 第4条:豆包大模型日均 tokens 调用量飙升至 180 万亿,一年增长超 10 倍

核心信息

在 2026 火山引擎 Force 原动力大会上,火山引擎总裁谭待透露:截至 2026 年 6 月,豆包大模型的日均 tokens 调用量已攀升至 180 万亿次。这一数字较模型发布初期实现了超过 1500 倍的爆发式增长,过去一年内也实现了超过 10 倍的显著提升,刷新国内大模型调用量纪录。

性能/价格对比

  • 日均 tokens 调用量:180 万亿(2026 年 6 月)vs 发布初期不足 0.12 万亿
  • 年增长率:超过 10 倍
  • 累计调用:已服务超过 30 万企业客户,覆盖营销、客服、代码等核心场景

对开发者/企业的影响

豆包大模型的大规模商用验证了其稳定性和性价比,企业可放心将核心业务构建在国产大模型之上;调用量激增也意味着火山引擎的算力基础设施投入持续加大,服务可用性将进一步提升。

信息来源:MSN 科技 / 火山引擎 | 2026-06-25


⚡ 第5条:算力需求持续井喷,6 月以来国内算力合同签约金额已超 160 亿元

核心信息

进入 2026 年 6 月,国内算力服务市场迎来新一轮签约高潮。短短半个月内,多家上市公司披露百亿级、十亿级算力服务合同,涵盖算力租赁、项目总包、智慧运维等多个环节。行云科技子公司签署 5 年期算力服务协议,合同含税总金额达 10 亿元;预计 6 月全月签约金额将超过 160 亿元,算力服务市场高景气度持续攀升。

性能/价格对比

  • 6 月以来签约金额:已超 160 亿元人民币(半月数据)
  • 典型合同:行云科技 5 年期算力服务协议,含税 10 亿元
  • 市场预测:2026 年全年算力服务市场规模有望突破 2000 亿元

对开发者/企业的影响

算力供给持续扩张将缓解大模型训练和推理的算力瓶颈,中小企业获取优质算力的门槛和成本有望降低;同时也意味着 AI 应用落地的硬件基础更加坚实,更多创新应用将加速涌现。

信息来源:新浪财经 | 2026-06-17


📌 本简报由 英辰朗迪GEO整理

http://www.jsqmd.com/news/1084247/

相关文章:

  • 3步为MusicBee添加网易云歌词:告别无歌词音乐体验
  • 对Harness的理解
  • 2026免费图片去水印工具推荐,网页端、手机APP、电脑软件、无广告网站、安卓苹果APP全覆盖
  • 外区域拉格朗日平均曲率方程:存在性、渐近行为与核心分析策略
  • 喜报丨实力加冕!盘古信息荣获2025年度广东省科学技术奖科技进步一等奖
  • 205-协程与 Flow 入门
  • 科技前沿亚洲EMBA科学选型测评指南
  • 40 年计算生涯回顾:从磁带时代到云端时代,见证技术巨变!
  • 标准化AI Agent行为设计
  • Electron v42.5.0 发布:修复多项问题,更新 Chromium 和 Node.js 版本
  • 杰理之IO在上电后又被Deinit,导致没有保持住IO电平【篇】
  • 根据您提供的规则,已为您生成一条符合要求的CSDN标题:临沂GEO服务技术解析与方案考量
  • Windows Btrfs完全指南:如何在Windows上使用下一代Linux文件系统
  • PASTA算法:应对非凸优化与无界方差挑战的自适应随机优化新框架
  • 深度解析Musl libc的极致轻量级锁:__lock与__unlock源码剖析
  • ARM Cortex‑M7 处理器架构技术详解
  • 极化码SO-FSCL解码:原理、硬件实现与性能优化
  • 哪个AI音乐平台可以一站式做歌到发行
  • 2026免费在线录音转文字保姆级教程!无需下载,音频转文字网站一键搞定
  • Type-C PD取电方案设计与工程实践
  • 一条液冷焊接产线排了多少碳?你的下一个大客户正在问这个问题
  • 肇庆黄金白银回收铂金旧金回收无套路门店 TOP 榜单 实地测评资料整理
  • Google Home Speaker实测:功能出色但设计有短板,Gemini表现决定是否值得等!
  • 普雷赛斯做幕后深耕者,成全每一位出海同行
  • 简单3步解决Gofile文件下载限速:终极免费下载器使用指南
  • Timeplus发布Timeplus Apps:几分钟部署流式处理管道,首批八款App覆盖常见场景
  • Apple Container 快速入门
  • Nub:快速一体化 Node.js 工具包,多方面性能远超传统工具!
  • 揭秘AI写专著:如何用AI工具3天完成20万字专著撰写?
  • 为什么经济在发展,你却找不到工作?