当前位置: 首页 > news >正文

【vLLM 学习】Simple Profiling

vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。

更多 vLLM 中文文档及教程可访问 →https://hyper.ai/notebooks/37048?utm_source=Distribute&utm_medium=Distribute-vLLM&utm_campaign=Distribute-vLLM-260126

*在线运行 vLLM 入门教程:零基础分步指南

源码 examples/offline_inference/simple_profiling.py

# SPDX-License-Identifier: Apache-2.0 import os import time from vllm import LLM, SamplingParams # 启用 torch 分析器,也可以在命令行设置 os.environ["VLLM_TORCH_PROFILER_DIR"] = "./vllm_profile" # 样本提示。 prompts = [ "Hello, my name is", "The president of the United States is", "The capital of France is", "The future of AI is", ] # 创建一个采样参数对象。 sampling_params = SamplingParams(temperature=0.8, top_p=0.95) if __name__ == "__main__": # 创建一个 LLM。 llm = LLM(model="facebook/opt-125m", tensor_parallel_size=1) llm.start_profile() # 从提示中生成文本。输出是 RequestOutput 的包含提示,生成文本和其他信息的对象列表。 outputs = llm.generate(prompts, sampling_params) llm.stop_profile() # 打印输出。 for output in outputs: prompt = output.prompt generated_text = output.outputs[0].text print(f"Prompt: {prompt!r}, Generated text: {generated_text!r}") # 添加一个缓冲区,在后台过程中等待 profiling(如果 MP 为 ON) 完成分析输出。 time.sleep(10)
http://www.jsqmd.com/news/332662/

相关文章:

  • 基于深度学习的人脸表情检测系统(YOLOv8+YOLO数据集+UI界面+Python项目+模型)
  • 2026化工、电子、医药厂房适用:推荐几家管道安装工程优质公司
  • 基于深度学习的传送带缺陷检测系统(YOLOv8+YOLO数据集+UI界面+Python项目+模型)
  • 品质之选:2026权威盘点性能卓越的玻璃反应釜品牌
  • 2026.2.2 讲题
  • 前端萌新别慌:用HTML+CSS画个会跳动的心,表白神器速成!
  • 2026年2月AI学习机TOP4评测:寒雪老师领衔,三大竞品各展细分优势
  • 救命神器8个降AIGC工具推荐 千笔·专业降AI率智能体解决论文查重难题
  • 打印机状态错误终极解决方案:2026年最全8种修复方案(含AI工具1句话搞定)
  • 开发外卖取餐码语音播报工具,输入取餐码自动语音提醒,支持自定义播报语速,解决外卖多找码难,手忙脚乱问题,适配手机端,无需复杂操作,精准播报不报错。
  • Citrix许可证管理与IT服务管理(ITSM)流程集成
  • 老房装修价格选购指南:2026年科学预算与避坑全攻略
  • 重磅发布 | 2026杭州GEO优化服务优质供应商榜单:AI工具源头厂家排名一览
  • 深入浅出Java Condition 的await和signal机制(二)
  • 必看!半导体工艺代工服务商+新工艺验证技术服务实力厂家汇总,性价比首选出炉
  • springboot乐淘购物系统的设计与实现 开题报告
  • Word通配符技巧:高效文档处理指南
  • 高端宝宝起名定制公司哪家靠谱值得推荐?
  • 计算机毕业设计之基于Python的疫情数据分析系统
  • 建议收藏:运维大佬都会用的Vim命令技巧
  • 收集知识≠知识,知识在脑中,工具只是辅助
  • 计算机毕业设计之springboot校园智能停车收费监控系统的设计与实现
  • 教育行业用百度UM搭建校务系统时,如何处理WORD通知中图片的格式兼容?
  • 2026年最新版 Bloodshed Dev C++下载与安装配置完整图文教程
  • AI市场分析:原圈科技揭秘企业如何赢得未来十年竞争
  • 运维系列【仅供参考-推荐】:为网站配置HTTPS(Nginx SSL证书设置)
  • DHCP简介
  • 风险周报 | 全球供应链风险事件汇总:多地发生火灾,车厘子等迎涨价潮!
  • 互联网站群管理时,百度UMEDITOR如何统一处理多站点WORD图片粘贴需求?
  • 期货与期权一体化平台结构边界定义实践指南