当前位置: 首页 > news >正文

使用指定的显卡运行模型

使用指定的显卡运行模型

指定使用第0块显卡启动qianwen3-8b模型,运行如下命令:

CUDA_VISIBLE_DEVICES=1 /usr/local/python310/bin/python3 /usr/local/python310/bin/vllm serve /data/llm/qianwen3/8b --max-model-len 16384 --port 81 --api-key 1234 --dtype=half --disable-log-requests --disable-log-stats

指定使用第1和第3块显卡启动qianwen3-8b模型,运行如下命令:

CUDA_VISIBLE_DEVICES=1,3 /usr/local/python310/bin/python3 /usr/local/python310/bin/vllm serve /data/llm/qianwen3/8b --max-model-len 16384 --port 82 --api-key 92322 --dtype=half --disable-log-requests --disable-log-stats

通过脚本方式启动,脚本内容如下:

#use gpu-1
export CUDA_VISIBLE_DEVICES=1
/usr/local/python310/bin/vllm serve /data/llm/baai/bgelargezh/15b  --trust-remote-code  --port 83  > /data/log/vllm_baai-beglargezh.log 2>&1 &

 

http://www.jsqmd.com/news/43294/

相关文章:

  • 2025年南京高功率密度电源公司综合实力TOP10,铁路电源/全国产化电源/车载电源/模块电源/军用电源/辅助应急电源供应商推荐榜单
  • 2025年国内封闭母线槽厂家综合实力排行榜TOP10
  • 2025年质量好的高端别墅系统门窗厂家推荐及选择参考
  • 关于跨网文件交换系统的常见问题及回答 看这一篇就够了!
  • 信息泄露漏洞分析报告
  • 2025年口碑好的系统门窗行业内口碑厂家排行榜
  • 从“单点替代”到“体系化替代”:国产DevOps厂商在信创生态中的“黏合剂”角色
  • 2025 最新尼龙扎带厂家推荐!尼龙扎带/不锈钢扎带/线卡/定位片厂家权威测评榜:源头厂家品质之选,兼顾耐用性与性价比
  • FPGA硬件加速卡设计原理图:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片
  • 2025年新疆租车公司权威推荐榜单:新疆租皮卡车/新疆自驾游租车/新疆越野车租车服务企业精选
  • 2025年铝合金电缆厂家权威推荐榜单:控制电缆/特种电缆/耐火电力电缆源头厂家精选
  • 2025年11月大路灯推荐榜单:十强排名对比全解析
  • 2025年西安买房开发商综合实力排行榜TOP10揭晓
  • JL-01 多点土壤温湿度记录仪 多通道同时在线监测 断电自动保护 数据稳定性好
  • 2025年铜芯电缆厂家权威推荐榜单:控制电缆/特种电缆/铝合金电缆源头厂家精选
  • 2025年四川304不锈钢桥架厂家排名前十权威推荐
  • 三、重定向输入和输出
  • 四、管道符
  • 2025年11月geo服务商排行榜:十大优质企业综合实力与长期发展指南
  • 六、退出脚本
  • 24、Linux服务运行级别
  • 23、文件权限管理
  • 22、磁盘分区、挂载
  • 2025年比较好的不锈钢金属波纹管设备厂家实力及用户口碑排行榜
  • 21、磁盘管理命令 df、du、tree
  • 18、crontab 定时任务
  • 用HBuilder查询天气等状态
  • 基于java+springboot的租房网站、房屋出租、房屋租赁管理系统源码+运行步骤
  • 17、cd 切换目录 ,pwd 查询目录路径
  • 16、at 定时任务