当前位置: 首页 > news >正文

世上最全NVDIA GPU参数列表: B300,H200,H100、H20、A100, A800,V100,3090,4090,5090等性能参数

-3)B300、B200、H200、H100参数比较

规格项B300B200H200H100
架构Blackwell UltraBlackwellHopperHopper
显存288 GB HBM3e192 GB HBM3e141 GB HBM3e80 GB HBM3e
显存带宽8 TB/s8 TB/s4.8 TB/s3.35 TB/s
FP4 稀疏算力14,000 TFLOPS9,000 TFLOPSN/AN/A
FP8 稠密算力7,000 TFLOPS4,500 TFLOPS756 TFLOPS756 TFLOPS
FP16 算力3,500 TFLOPS2,250 TFLOPS378 TFLOPS378 TFLOPS
TDP1,400W1,000W700W700W
NVLink 带宽1.8 TB/s1.8 TB/s900 GB/s900 GB/s
GPU架构FP8(Dense)算力显存显存带宽NVLink
B300Blackwell Ultra7000 TFLOPS288GB HBM3e8 TB/s1.8 TB/s
B200Blackwell4500 TFLOPS192GB HBM3e8 TB/s1.8 TB/s
H200Hopper756 TFLOPS141GB HBM3e4.8 TB/s900 GB/s
H100Hopper756 TFLOPS80GB HBM3e3.35 TB/s900 GB/s

-2)H20,L20芯片

20250715,

【美国已批准英伟达 H20 芯片在华销售】

据英伟达官方消息,H20对中国大陆市场的销售许可获批。

其实H20性能一般,已经是上一代产品了。美国真恶心人啊

参数H20L20
GPU架构NVIDIA HopperNVIDIA Ada Lovelace
内存类型HBM3GDDR6(带ECC)
内存容量96 GB48 GB
内存带宽4.0 TB/s864 GB/s
INT8/FP8算力296 TFLOPS239 TFLOPS
BF16/FP16算力148 TFLOPS119.5 TFLOPS
TF32算力74 TFLOPS59.8 TFLOPS
FP32算力44 TFLOPS59.8 TFLOPS
NVLink支持支持(900 GB/s)不支持
MIG功能最多7个实例未知
L2缓存60 MB96 MB
热设计功耗(TDP)400 W275 W
外形规格8路HGX(SXM接口)2槽FHFL(PCIe Gen4 x16)
适用场景大模型推理、多卡协同工作站、服务器推理

-1)GeForce RTX 4090

价格便宜,推理性能较好。

GeForce RTX 4090

GPU 引擎规格:NVIDIA CUDA® 核心数量16384
加速频率 (GHz)2.52
基础频率 (GHz)2.23
显存规格:标准显存配置24 GB GDDR6X
显存位宽384 位
技术支持:Ray Tracing Core第 3 代
Tensor Cores第 4 代
NVIDIA 架构Ada Lovelace
支持 NVIDIA DLSS3
支持 NVIDIA Reflex
支持 NVIDIA Broadcast
支持 PCI Express 第 4 代
支持 Resizable BAR
支持 NVIDIA® GeForce Experience™
支持 NVIDIA Ansel
支持 NVIDIA FreeStyle
支持 NVIDIA ShadowPlay
支持 NVIDIA Highlights
支持 NVIDIA G-SYNC®
Game Ready 驱动
支持 NVIDIA Studio 驱动
NVIDIA Omniverse
支持 Microsoft DirectX® 12 Ultimate
支持 NVIDIA GPU Boost™
支持 NVIDIA NVLink™ (SLI-Ready)
支持 Vulkan RT API, OpenGL 4.6
NVIDIA 编码器 (NVENC)2x 8th Generation
NVIDIA 解码器 (NVDEC)5th Generation
AV1 编码
AV1 解码
CUDA 能力8.9
支持 VR Ready
显示器支持:最高数字分辨率和刷新率 (1)4K 240Hz 或借助DSC技术支持,显示8K 60Hz HDR效果
标准显示器接口HDMI(2), 3x DisplayPort(3)
可支持的多显示器数4(5)
HDCP2.3
显卡尺寸:长度304 mm
宽度137 mm
插槽3 插槽 (61mm)
温度和功率规格:最高 GPU 温度 (℃)90
显卡功率 (W)450 W
要求的系统功率 (W) (4)850 W
辅助电源接口3 x PCIe 8-pin 转接线(附赠适配器)或
1 根支持 450W 及更大额定功率的第 5 代 PCIe 接口电源线

0)GeForce RTX 3090显卡,好像没有单双精度数据?

GeForce RTX 3090 TiGeForce RTX 3090
GPU 引擎规格:NVIDIA CUDA® 核心数量1075210496
加速频率 (GHz)1.861.70
基础频率 (GHz)1.671.40
显存规格:标准显存配置24 GB GDDR6X24 GB GDDR6X
显存位宽384 位384 位
技术支持:RT Core第 2 代第 2 代
Tensor Cores第 3 代第 3 代
NVIDIA 架构AmpereAmpere
Microsoft DirectX® 12 Ultimate
NVIDIA DLSS
NVIDIA Reflex
NVIDIA Broadcast
PCI Express 第 4 代
Resizable BAR
NVIDIA® GeForce Experience™
NVIDIA Ansel
NVIDIA FreeStyle
NVIDIA ShadowPlay
NVIDIA Highlights
NVIDIA G-SYNC®
支持 Game Ready 驱动程序
NVIDIA Studio 驱动
NVIDIA Omniverse
NVIDIA GPU Boost™
NVIDIA NVLink™ (SLI-Ready)
Vulkan RT API、OpenGL 4.6
HDMI 2.1
DisplayPort 1.4a
NVIDIA 编码器第 7 代第 7 代
NVIDIA 解码器第 5 代第 5 代
CUDA 能力8.68.6
VR Ready
显示支持:最高数字分辨率 (1)7680x43207680x4320
标准显示器接口HDMI(2), 3x DisplayPort(3)HDMI(2), 3x DisplayPort(3)
可支持的多显示器数44
HDCP2.32.3
Founders Edition 显卡尺寸:长度12.3" (313 mm)12.3" (313 mm)
宽度5.4" (138 mm)5.4" (138 mm)
高度3 插槽3 插槽
Founders Edition 热功率规格:最高 GPU 温度 (℃)9293
显卡功率 (W)450350
推荐系统功率 (W) (2)850750
辅助电源接口3 个 PCIe 8-Pin 辅助供电接口(盒装适配器)或负载可达 450W 或更高的第五代 PCIe 接口2 个 PCIe 8-Pin 接口

1)

A40:

The NVIDIA A40 accelerates the most demanding visual computing workloads from the data center, combining the latest NVIDIA Ampere architecture RT Cores, Tensor Cores, and CUDA® Cores with 48 GB of graphics memory. From powerful virtual workstations accessible from anywhere to dedicated render nodes, NVIDIA A40 brings nextgeneration NVIDIA RTX™ technology to the data center for the most advanced professional visualization workloads.

居然没有单双精度。

带宽也不行。

2)

A30:

Built for AI inference at scale, the same compute resource can rapidly re-train AI models with TF32, as well as accelerate high-performance computing (HPC) applications using FP64 Tensor Cores. Multi-Instance GPU (MIG) and FP64 Tensor Cores combine with fast 933 gigabytes per second (GB/s) of memory bandwidth in a low 165W power envelope, all running on a PCIe card optimal for mainstream servers.

3)A100

NVIDIA A100 GPU采用全新Ampere安培架构的超大核心GA100,7nm工艺,542亿晶体管,826平方毫米面积,6912个核心,搭载5120-bit 40/80GB HBM2显存,带宽近1.6TB/s,功耗400W。

NVIDIA A100 Tensor Core GPU 可在各个规模下为 AI、数据分析 和高性能计算(HPC)应用提供出色的加速性能,为全球的 高性能弹性数据中心提供强劲助力。作为 NVIDIA 数据中心平台 的引擎,与前一代 NVIDIA Volta™ 相比,A100 可使性能提升高达 20 倍。A100 可高效扩展,也可借助多实例 GPU (MIG)技术划分 为 7 个独立的 GPU 实例,从而提供统一的平台,助力弹性数据中 心根据不断变化的工作负载需求动态进行调整。 NVIDIA A100 Tensor Core 技术支持广泛的数学精度,可针对每个 工作负载提供单个加速器。最新一代 A100 80GB 将 GPU 显存 加倍,提供 2TB/s 的全球超快显存带宽,可加速处理超大型模型 和海量数据集。 A100 是完整 NVIDIA 数据中心解决方案的一部分,该解决方案由 硬件、网络、软件、库以及 NGC™ 目录中经优化的 AI 模型和 应用等叠加而成。作为适用于数据中心且功能强大的端到端 AI 和 HPC 平台,A100 可助力研究人员获得真实的结果,并能将解决 方案大规模部署到生产环境中。

可惜不让在中国卖,万恶的鬼佬。

4)V100

NVIDIA® V100 Tensor Core GPU 是深度学习、机器学习、 高性能计算 (HPC) 和图形计算的强力加速器。V100 Tensor Core GPU 采用 NVIDIA Volta™ 架构,可在单个 GPU 中提供近 32 个 CPU 的性能,助力研究人员攻克以前无法应对的挑战。 V100 已在业界首个 AI 基准测试 MLPerf 中拔得头筹,以出色 的成绩证明了其是具有巨大可扩展性和通用性的当今世界上 强大的计算平台。

比A100差不些,但是比A30好一些。

美国人脑壳也是逗比

5)A800

NVIDIA将面向中国用户推出新的A800 GPU,用于替代A100,其符合美政府出口管制政策。根据美政府的政策,用于出口的芯片数据传输率不得超过600GB/s,NVIDIA A800则设定在400GB/s。但其他规格尚不清楚,比如核心数量、运行频率、显存、功耗等。

,英伟达和 AMD 就表示,包括英伟达的数据中心芯片 A100 和 H100 等产品,被美国商务部列入出口管制清单。

而据英伟达的说法,新的 A800 可以替代 A100,两者都是 GPU(图形处理单元)处理器。芯片经销商 OMNISKY 容天官网介绍的英伟达 A800 GPU 信息显示,新的芯片数据传输速率为每秒 400GB,低于 A100 的每秒 600GB,代表了数据中心的性能明显下降。而且,A800 支持内存带宽最高达 2TB/s,其他参数变化不大。

6)炸裂的H100

NVIDIA H100是一个整体NVIDIA数据中心的一部分站台为AI、HPC和数据构建分析,平台加速

超过3000个应用程序,并且数据无处不在从中心到边缘,同时提供显著的性能提升和节省成本的机会。

双精度性能达到34TFlops了!天啊

FP16达到2TFlops,间接是AI怪兽!

访存带宽达到3.35TB

NVLINK带宽达到900 GB/s,天啊

7)H200

H200比H100好一些,但是也没有很好,在LLM有优势。

单卡性能方面,H200相比H100,在Llama2的130亿参数训练中速度提升40%,在GPT-3的1750亿参数训练中提升60%,在Llama2的700亿参数训练中提升90%。

http://www.jsqmd.com/news/611709/

相关文章:

  • 2026年昆山离婚打官司最厉害的律师服务解析 - 品牌排行榜
  • 算法工具箱之双指针
  • C++和OpenGL实现3D游戏编程【连载23】——几何着色器和法线可视化
  • Mermaid 绘图
  • 2026年HENF级板材品牌有哪些?环保性能与技术解析 - 品牌排行榜
  • 01_Doris 4.0 AI能力全景解析:从 OLAP 到智能数据底座的演进
  • STM32——HAL库开发笔记5(UART理论篇)(参考来源:b站铁头山羊)
  • 2026年CRO公司推荐:临床前研究服务的专业之选 - 品牌排行榜
  • 2026经管专业就业后学习数据分析的价值分析
  • Phi-3-mini-4k-instruct-gguf精彩案例:用户调研报告→核心发现→行动建议三级生成
  • 分布式系统
  • 2026年苏州私立民办学校如何选择?关键因素参考 - 品牌排行榜
  • 从‘循环对称’这个词说起:聊聊无线通信里噪声模型的那些‘潜规则’
  • 3分钟掌握手机号码定位技术:一键查询号码归属地与地理位置
  • 终极指南:如何利用Awesome DevSecOps构建企业安全文化全流程
  • Unity3D 快速入门 1 - 界面操作
  • 2026年昆山查老赖财产最靠谱的律师服务解析 - 品牌排行榜
  • 接雨水——单调栈(python)
  • 关于Java EE应用中xml解析类的问题
  • 使用Phi-4-mini-reasoning优化算法逻辑:以LSTM时间序列预测为例
  • MiniCPM-o-4.5-nvidia-FlagOS进阶:使用Matlab进行模型输出数据的可视化分析
  • 2026年质量好的仿棉天鹅绒/金丝绒天鹅绒/经编天鹅绒/平板天鹅绒公司口碑哪家靠谱 - 品牌宣传支持者
  • 亲测8款AI写论文神器,维普查重一把过,零AIGC痕迹 - 麟书学长
  • JointJS部署与打包终极指南:从开发到生产环境的完整实践
  • WeKnora新手必看:无需代码,三步创建属于你的即时知识问答系统
  • 使用Phi-4-mini-reasoning进行软件测试用例智能生成与面试题解析
  • FFmpeg在RK3588上的完整移植教程:从交叉编译到CMake集成
  • Flutter Engine热重载原理:开发效率提升的黑科技
  • Hypersistence Utils数组类型深度解析:PostgreSQL ARRAY到Java List的完美映射
  • 2026年昆山执行案件口碑好的律师推荐及选择建议 - 品牌排行榜