当前位置: 首页 > news >正文

4090模型切换

image

 

image

 

image

 

 

8B:

vllm serve /home/xurui/.cache/modelscope/hub/models/Qwen/Qwen3-8B \
--served-model-name qwen3-8b \
--host 0.0.0.0 \
--port 5001 \
--enable-lora \
--lora-modules xiaohui=/home/xurui/nanwang/qwen3_8b_xiaohui fgpt=/home/xurui/nanwang/qwen3_8b_fgpt \
--max-loras 2 \
--max-lora-rank 64 \
--gpu-memory-utilization 0.9 \
--max-model-len 25600 \
--dtype auto \
--enable-auto-tool-choice \
--tool-call-parser qwen3_coder
 
4B:
vllm serve /home/xurui/.cache/modelscope/hub/models/Qwen/Qwen3-4B-Instruct-2507 \
--served-model-name qwen3-4b \
--host 0.0.0.0 \
--port 5001 \
--enable-lora \
--lora-modules xiaohui=/home/xurui/nanwang/qwen3_4b_xiaohui fgpt=/home/xurui/nanwang/qwen3_4b_fgpt \
--max-loras 2 \
--max-lora-rank 64 \
--gpu-memory-utilization 0.9 \
--max-model-len 25600 \
--dtype auto \
--enable-auto-tool-choice \
--tool-call-parser qwen3_coder
http://www.jsqmd.com/news/370475/

相关文章:

  • wireshark
  • 基于DirectX和C#的三维显示控件实现
  • Codeforces Round 1078 (Div. 2) A,B,C,D,E,F1个人题解 - CUC
  • Distributed Hybrid Parallelism for Large Language Models Comparative Study and System Design Guide
  • 铝箔胶带行业深度报告:五大标杆企业解析与市场趋势洞察 - 深度智识库
  • 中国OIer失去OI体力了?
  • opengauss中安装PostGIS - 教程
  • 中原装备标杆 开封金盛机械赋能多领域加工升级 - 朴素的承诺
  • 国内十大老字号制药公司,百姓信赖的健康标杆 - 包罗万闻
  • 自动化立体仓库品牌深度对比评测:全栈自研与行业定制成核心竞争力 - 品牌策略主理人
  • 输入停车场各区域实时车位,引导车辆驶向空闲最多的区域。
  • 强烈安利 9个 AI论文网站:本科生毕业论文写作全测评
  • Oppo应用市场获取商店URL
  • ooderNexus 实测揭秘:一个正在成长的 P2P AI 能力分发平台
  • 我用 5 个 Claude 角色复刻一个能交付的开发团队 - 147API
  • 深度感知算法在人形机器人中的应用:骨骼追踪技术
  • 2026仿真动物艺术与彩灯文创优选推荐 西南标杆引领行业多元发展 - 深度智识库
  • 干货合集:8个AI论文网站测评!自考毕业论文+格式规范全攻略
  • ESPIDF 分区表保姆级详解
  • AI/AGI时代数据为王:隐私和伦理是指路明灯还是前行中的桎梏
  • 架设服务器和租用服务器哪个更划算
  • 便携式设备的防盗报警器设计
  • 吐血推荐 9个降AIGC软件:本科生降AI率必备测评与推荐
  • 便携式温度检测记录系统
  • 便携式头盔外观造型设计
  • 赶deadline必备! 10个AI论文工具测评:自考毕业论文+格式规范全攻略
  • 强烈安利 9个降AI率软件降AIGC网站:研究生必看的降AI率工具深度测评
  • IPD咨询:如何通过组织与流程重构提升产品成功率?
  • 负债必看|2026靠谱信用卡贷款协商机构榜单,无套路不踩坑,和律掌柜亲测能上岸 - 代码非世界
  • 炸鸡汉堡外卖哪家好吃,送过来不软趴?美团外卖更划算! - Top品牌推荐