当前位置: 首页 > news >正文

微软推出算力高达10000TFLOPS的AI加速器Maia200, 主要用于推理, 台积电3nm制程

https://blogs.microsoft.com/blog ... uilt-for-inference/

Maia 200 —— 一款突破性的推理加速器,旨在大幅改善 AI token 生成的经济性。Maia 200 是一款强大的 AI 推理引擎:它采用台积电 3nm 制程打造,配备原生 FP8/FP4 张量核心,重新设计的内存系统,拥有 216GB HBM3e(带宽达 7 TB/s) 和 272MB 片上 SRAM,并结合数据传输引擎,确保超大模型能够持续、高速且高利用率地运行。

这使得 Maia 200 成为所有超大规模云服务商中性能最强的第一方自研芯片,其 FP4 性能是第三代 Amazon Trainium 的三倍,FP8 性能也超过了谷歌第七代 TPU。同时,Maia 200 也是微软迄今部署过的最高效推理系统,其每美元性能比当前机群中最新一代硬件提升了 30%。


Maia 200 是我们异构 AI 基础设施的一部分,将服务于多个模型,包括来自 OpenAI 的最新 GPT-5.2 模型,为 Microsoft Foundry 和 Microsoft 365 Copilot 带来更优的性价比优势。微软超级智能(Superintelligence)团队将使用 Maia 200 进行合成数据生成和强化学习,以提升下一代自研模型的能力。
在合成数据流水线场景中,Maia 200 的独特设计有助于加速高质量、特定领域数据的生成与筛选,为下游训练提供更新、更有针对性的信号。

Maia 200 目前已部署在美国中部数据中心区域(爱荷华州得梅因附近),接下来将部署于美国西部 3 区域(亚利桑那州菲尼克斯附近),未来还将扩展到更多区域。Maia 200 与 Azure 实现无缝集成,我们正在预览 Maia SDK,提供一整套用于在 Maia 200 上构建和优化模型的工具。
该 SDK 包含完整能力集,包括 PyTorch 集成、Triton 编译器与优化内核库,以及对 Maia 底层编程语言的访问权限。这使开发者在需要时能够进行细粒度控制,同时也支持在异构硬件加速器之间轻松移植模型。

http://www.jsqmd.com/news/314415/

相关文章:

  • LFM信号与P4码组合调制波形的脉冲压缩与模糊函数分析
  • 小程序毕设项目推荐-基于springboot的文物知识科普文物时讯微信小程序【附源码+文档,调试定制服务】
  • 小程序毕设项目:基于手机端的陕西地区特色农产品团购平台设计与实现小程序(源码+文档,讲解、调试运行,定制等)
  • 关于CPU的介绍(四)----CMO(Cache Maintenance Operations)
  • 【课程设计/毕业设计】基于springboot的文物知识科普“江西文物时讯”微信小程序博物馆文物科普知识普及系统微信小程序【附源码、数据库、万字文档】
  • 计算机小程序毕设实战-基于springboot的文物知识科普“江西文物时讯”微信小程序【完整源码+LW+部署说明+演示视频,全bao一条龙等】
  • 【计算机毕业设计案例】博物馆文物科普知识普及系统微信小程序基于springboot的文物知识科普“江西文物时讯”微信小程序(程序+文档+讲解+定制)
  • 【毕业设计】基于微信小程序的驾校预约系统的设计与实现(源码+文档+远程调试,全bao定制等)
  • 【毕业设计】基于手机端的陕西地区特色农产品团购平台设计与实现小程序(源码+文档+远程调试,全bao定制等)
  • 小程序计算机毕设之基于springboot的文物知识科普“江西文物时讯”微信小程序(完整前后端代码+说明文档+LW,调试定制等)
  • opencv实现图像拼接
  • 上海药物所突破:AI滤波器精准筛选神经系统疾病新药
  • 20260128让天启AIO-3576Q38开发板在天启Buildroot下适配uart2m1
  • 第六届机械设计与仿真国际学术会议(MDS 2026)
  • 【EI期刊征稿、EI(JA)检索】第五届智能电网和绿色能源国际学术会议(ICSGGE 2026)
  • 【EAI-JA期刊】第二届能源系统与电气工程国际学术会议(ESEE 2026)
  • 【SPIE出版】2026计算机科学与量子信息技术国际会议(CSQIT 2026)
  • 在农村,Wi-Fi 7是利器还是摆设?
  • KaiwuDB 分布式执行引擎的演进之路
  • 情感视角:AI伦理测试中的开发者责任
  • SYNBO AMA 回顾|将共识转化为 Alpha
  • 为什么企业总感觉“招不到合适的人“?90%的招聘失败源于什么?
  • Markdown学习(Typora使用简单说明)
  • 前端开发必备:VS Code的6个“效率插件”,
  • VC60注释与取消注释快捷键使用指南
  • 基于plc的四节传送带控制系统设计(s7-1200)(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_文章底部可以扫码
  • 如何选择适合的环境噪声在线监测设备?
  • 上海团队让人人都能当“数字城市建造师“
  • 计算机毕业设计springboot基于协同过滤算法的服装风格推荐系统 基于用户行为分析的个性化服饰搭配推荐平台设计与实现 融合协同过滤技术的时尚穿搭智能推荐引擎构建
  • 计算机毕业设计springboot中国非物质文化遗产宣传管理系统 基于Spring Boot的中华传统非物质文化遗产数字化保护与推广平台 面向Web的华夏非遗文化资源智能管理与多维度展示系统