当前位置: 首页 > news >正文

【vLLM 学习】Reproduciblity

vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。

更多 vLLM 中文文档及教程可访问 →vllm.hyper.ai/

*在线运行 vLLM 入门教程:零基础分步指南

源码 examples/offline_inference/reproduciblity.py

# SPDX-License-Identifier: Apache-2.0importos from vllmimportLLM, SamplingParams# 为了性能考虑,vllm 不能保证结果的默认情况下可重复性,# 您需要做以下事情才能实现# 可复现结果:# 1.关闭多处理以使计划确定性。# Note (Woosuk) :这是不需要的,对于 V0而言,这将被忽略。os.environ["VLLM_ENABLE_V1_MULTIPROCESSING"]="0"# 2.修复五十年据种子以获得可重复性。默认种子为 None,不可复现。SEED=42# Note (Woosuk) :即使使用上述两个设置,vLLM 也仅提供# 当它在相同的硬件和相同的 vLLM 版本上运行时,它的可重复性。# 此外,在线服务 API ( "vLLM 服务") 不支持可重复性# 因为几乎不可能在在线服务设置。llm=LLM(model="facebook/opt-125m",seed=SEED)prompts=["Hello, my name is","The president of the United States is","The capital of France is","The future of AI is",]sampling_params=SamplingParams(temperature=0.8,top_p=0.95)outputs=llm.generate(prompts, sampling_params)foroutputinoutputs: prompt=output.prompt generated_text=output.outputs[0].text print(f"Prompt: {prompt!r}, Generated text: {generated_text!r}")
http://www.jsqmd.com/news/166340/

相关文章:

  • Miniconda-Python3.9环境下批量安装常用AI库(PyTorch/TensorFlow/scikit-learn)
  • Java对象头(Object Header)
  • PyTorch DataLoader性能瓶颈排查:从Miniconda环境入手
  • 2025年AI行业热点:应用层核心技术人才年薪破百万,字节跳动、腾讯等巨头争相布局黄金赛道!
  • PyTorch Geometric等扩展库在Miniconda-Python3.9中的安装方法
  • PyTorch自定义算子开发环境搭建:Miniconda-Python3.9指南
  • 「地质约束显式+数据驱动模型」的新路径,浙江大学团队实现跨区域矿产远景预测性能和可解释性提升
  • PyTorch批处理任务调度:Miniconda-Python3.9环境自动化脚本
  • Miniconda-Python3.9结合Markdown编写可执行AI技术文档
  • PyTorch QoS保障机制:基于Miniconda-Python3.9环境实现
  • 2025年AI领域全景观察:从大模型突破到Agent架构,开发者必读的技术趋势指南!
  • PyTorch模型微调任务的最佳Miniconda-Python3.9配置方案
  • 收藏!大模型入门避坑指南:小白/程序员专属学习路径+全套资源清单
  • PyTorch实验日志记录系统搭建:Miniconda-Python3.9基础环境
  • 从Manus被Meta收购看AI创业浪潮,普通程序员如何抓住大模型时代红利?
  • Miniconda-Python3.9环境下实现PyTorch模型差分隐私训练
  • PyTorch模型剪枝与蒸馏实验环境:Miniconda-Python3.9搭建
  • 吃透可编程控制器,可编程控制器基本知识介绍
  • 从运营到AI产品经理:3个月自学转型之路,揭秘原型图、数据分析与AI理论三大技能的学习路径!
  • PyTorch概念漂移适应机制:Miniconda-Python3.9环境实验
  • PyTorch模型注册中心对接:Miniconda-Python3.9环境准备
  • 收藏!一文理清LangChain、LangGraph与DeepAgents:AI智能体开发三层体系拆解
  • PyTorch自动微分机制验证:Miniconda-Python3.9环境实操
  • Miniconda-Python3.9是否支持PyTorch 2.x最新特性体验?
  • PyTorch异步推理任务处理:Miniconda-Python3.9环境队列设计
  • 揭秘背后真相:为何大厂都在秘密布局AI Agent?普通人如何以低成本加入这场科技革命
  • 大湾区创业者社群推荐:选对圈子,让创业少走弯路 - 黑马榜单
  • Miniconda-Python3.9环境下使用PyTorch进行张量运算测试
  • Miniconda-Python3.9环境下验证PyTorch是否成功启用GPU
  • Spring 中的依赖注入与数据源对象管理详解(基于黑马ssm网课课程总结)