当前位置: 首页 > news >正文

使用vLLM实测3090和4090的大模型推理性能

之前使用Ollama基于顺序调用的场景比较了3090和4090的显卡性能:
Ollama大模型推理场景下3090和4090性能实测

同时,又基于3090显卡比较了OllamavLLM在顺序调用和多并发推理场景下的性能差异:
Ollama和vLLM大模型推理性能对比实测

这里再使用vLLM测试下大模型并发推理场景下3090和4090两张显卡的性能表现,看下4090是否在高并发场景下具备更高的扩展性。

在GPU算力租用平台 晨涧云 分别租用3090显卡和4090显卡的vLLM云容器进行测试。

大模型选择

选择 Qwen3的模型进行测试,考虑到都是24GB的显存,选择的是FP16精度的qwen3:8b模型进行测试。

借助DeepSeek 生成测试脚本,调整脚本控制变量:

  • 使用复杂度近似的N个prompts;

  • MAX_TOKENS配置256,让每次请求需要一定的生成时长便于采样显卡的使用指标,减少波动;

  • 选择[1, 4, 8, 16] 4种BATCH_SIZES测试不同并发度下的性能表现;

  • 每轮测试执行3次推理,指标取平均;

  • 同时需要模型预热,消除第一次推理响应延时过大的问题。

然后执行推理性能测试脚本,查看输出结果。

3090推理性能

3090-vLLM大模型推理测试结果

4090推理性能

4090-vLLM大模型推理测试结果

测试结果解释

  • Batch Size:一次推理调用的并发prompt数量

  • 平均耗时 (s):多次推理平均响应时长

  • 平均吞吐量 (tokens/s):多次推理平均Token生成速度

  • 平均显存 (MB):多次推理平均显存使用量

  • 平均GPU使用率(%):多次推理平均GPU使用率

3090显卡和4090显卡在模型推理过程中的显存和GPU使用率都比较接近,主要看平均耗时平均吞吐量两个指标:

Batch Size RTX 3090 RTX 4090 对比
1 平均耗时(s) 5.44 4.61
1 平均吞吐量(tokens/s) 47.10 55.60 118.0%
4 平均耗时(s) 5.61 4.87
4 平均吞吐量(tokens/s) 182.70 210.40 115.2%
8 平均耗时(s) 5.82 4.94
8 平均吞吐量(tokens/s) 351.90 414.50 117.8%
16 平均耗时(s) 6.42 5.13
16 平均吞吐量(tokens/s) 638.40 798.50 125.1%

1~8并发度场景下,3090和4090的推理性能均保持稳定,4090比3090高17%左右;在16并发度下3090开始遇到性能瓶颈,而4090显然较3090有更充足的剩余性能空间。

http://www.jsqmd.com/news/33477/

相关文章:

  • CF1700F Puzzle
  • Redis高可用与高并发探险之旅:从单机到集群的完美进化【第三部分】
  • UE:论运行时动画录制的关键-正确获取骨骼数据与保存
  • 线性基相关
  • 关于fcitx5预览窗口部分emoji乱码问题
  • a-menu 当设置折叠状态如何穿透悬浮菜单样式
  • attention论文及Transformer工作原理概述
  • kamailio+rtpengine对sdp的处理
  • 软工团队项目第一次作业
  • 低代码权限管理安全合规指南:守住数据安全的 “最后一道防线”
  • 2025-11-06
  • 低代码权限管理常见场景解决方案:精准适配不同业务需求
  • 不适用模型的简易ai交互页面
  • 关于waybar状态栏颜文字乱码问题
  • 自己的火印
  • P10277 [USACO24OPEN] Bessies Interview S 题解
  • 基于AIGC的图表狐深度评测:自然语言生成专业级统计图表的高效的技术实现
  • AI 时代的数据库进化论 —— 从向量到混合检索
  • 深入解析:操作系统基础:了解进程、线程、协程,理解I/O模型(阻塞/非阻塞,同步/异步)。
  • vue 3.x 前端导出功能
  • 最高法-合同目的的认定
  • 2025年恒温恒湿机标杆厂家最新推荐:中焓环境,档案室恒湿机/精密恒温恒湿机/吊顶恒温恒湿机/档案室恒温恒湿机,定义环境控制精准新标准
  • 2025年恒温恒湿厂家及恒湿设备标杆之选:中焓环境,适配机房/档案室/展柜等场景
  • 酸角糕行业发展趋势解析:2025年十大品牌综合测评与选择指南
  • [题解]P6717 [CCO 2018] Boring Lectures
  • 2025年11月酸角糕行业十大厂家排行榜:探索健康零食的新趋势与优选指南
  • mysql 查看数据库大小
  • 2025年11月酸角糕厂家综合评测:健康零食新风向与选购全攻略
  • 2025年11月酸角糕十大厂家权威排行榜:天然健康零食优选指南
  • oi 卡时技巧