当前位置：首页 > news >正文

反讽环境安装

news 2026/6/19 19:06:18

云平台

租一台新的机子，4b模型跑在5090显卡上，可以选西北的机子，如果不想重新租也可以直接重置之前的机子
ps：不要选重庆的机子，因为之后好像端口映射不了。

这里选镜像的时候选如下就行

虚拟环境激活

开机后用ssh工具连接（只要能来连接ssh就可以，推荐xterminal）

连接到云服务器

在root目录下有个autodl-tmp，把所有重要数据都存在这个目录，避免关机重启被清除

启动后按照如下命令配置uv虚拟环境

pip install uv #先安装uv第三方库 cd /root/autodl-tmp #进入目录 mkdir Qwen #创建名叫Qwen文件夹 uv venv --python 3.12 #创建uv虚拟环境，并且指定python版本 source .venv/bin/activate #激活虚拟环境

激活后最前面有个qwen标识，代表已经进入虚拟环境

模型下载

进入虚拟环境后，先安装modelscope库，用来拉取模型

uv pip install modelscope #在uv环境中安装modelscope

modelscope download --model Qwen/Qwen3.5-4B #使用modelscope库下载模型文件

这里下载可能需要十分钟左右

因为下载路径未指定，所以应该是modelscope的默认路径：/root/.cache/modelscope/hub/models/Qwen/Qwen3.5-4B，下载成功后会在这个路径下存放所有的模型文件，需要把所有模型文件拷贝到/root/autodl-tmp/Qwen目录下，防止丢失

vllm推理器下载

下图是魔搭社区中关于vllm的官方下载方式，但是我试过了，不行，因为它默认下载最新版，和云服务器显卡以及cuda驱动之间可能存在冲突，需要下载指定版本0.18.1

uv pip istall vllm==0.18.1 --index-url https://mirrors.aliyun.com/pypi/simple/ #使用aliyun加速

这边下载也要十分钟左右

启动模型

VLLM_USE_MODELSCOPE=true vllm serve /root/autodl-tmp/Qwen/Qwen35-4B --port 6006 --tensor-parallel-size 1 --max-model-len 262144 --language-model-only #将服务开放在6006端口，/root/autodl-tmp/Qwen/Qwen35-4B这个路径就是存放模型的路径，之后调用代码里面需要和这里保持一致

第一次启动可能慢点，大概需要七八分钟，之后启动会快很多

出现如上界面代表启动成功，此时已经可以调用api服务了

autodl云平台会自动把内网的6006服务映射到公网上，如下图所示，调用代码中只需要将此链接复制就可以批量调用模型服务

关闭模型服务，只需要ctrl+C中断服务即可

脚本

因为是在云服务器上，所以不用的时候需要关机，所以下次启动的时候又需要重新进入虚拟环境，激活，然后再启动模型，比较繁琐

可以写一个bash脚本来一键启动,复制如下命令到start.sh

chmod +x start.sh（赋予脚本可执行的权限）

#!/bin/bash cd /root/autodl-tmp/Qwen source .venv/bin/activate VLLM_USE_MODELSCOPE=true vllm serve /root/autodl-tmp/CoASD \ #这里启动的模型是 --port 6006\ --tensor-parallel-size 1 \ --max-model-len 262144 \ --reasoning-parser qwen3 \ --language-model-only

以后每次启动模型./start.sh即可启动

微调

这部分写期刊论文应该用不到，期刊论文就聚焦多智能体，把多智能体模型讲得高大上一点就行，不需要微调

但之后做其他项目可以尝试微调，所以这边还是写了一下。

安装步骤：

微调采用llamafactory平台，可以再建一个虚拟环境，避免各种库的版本冲突

cd /root/autodl-tmp mkdir llama uv venv source .venv/bin/activate

之后安装都在虚拟环境中实现即可

安装教程参照：

LLaMA-Factory安装教程（详细版）_llamafactory安装-CSDN博客

查看全文

http://www.jsqmd.com/news/1043877/

计算机毕业设计博物馆票仓管理系统的设计与实现

AI+专业建设：高校专业课融入AI实操找哪家？

2026石家庄爱彼名表回收店铺TOP3榜单｜实地测评对比，高端橡树变现首选禹竞名奢汇 - 名奢变现站

Jetson Orin NX 开发指南（8）: EGO-Swarm 与 VINS-Fusion 的深度集成与实战调优

杭州黄金变现认准收的顶，不虚报、不扣杂，交易简单直来直去 - 奢侈品回收评测

青岛黄金回收专业商家：合扬精准测金对标大盘价专业估价 - 奢侈品交易观察员

7条干货避坑！2026武汉黄金回收哪家靠谱？本地实测榜单 - 奢侈品回收测评

2026无锡黄金回收攻略：本地人常去5家好店，顶价结算更透明 - 奢侈品回收评测

2026年源头自产新吨袋大揭秘，哪家划算一看便知！

2026论文必藏降AI率工具大曝光：一键把AIGC率降至安全线！

Superpaper终极指南：免费打造多显示器无缝壁纸体验

把“节能”变成可落地系统

杭州黄金回收排行：婚嫁金、旧首饰、投资金变现差异 - 奢侈品回收评测

2026 滁州防水补漏靠谱服务商盘点：屋面 / 厨卫 / 外墙 / 地下室渗水维修详解，适配皖东江淮丘陵池河沿岸防潮防水甄选指南 - 宅安选房屋修缮

2026年广州变频器回收服务商哪家可靠，三菱伺服驱动器回收/西门子PLC回收/松下PLC回收，变频器回收中心怎么选择 - 品牌推荐师

AR500系列路由器未开会话老化日志导致无NAT日志

3步掌握ComfyUI_TTP_Toolset：普通显卡也能轻松处理8K超分辨率图像

从理论到实践：Aspice SWE.1软件需求分析如何驱动高质量软件开发

面向APP/Web 加解密逆向分析、渗透测试人员的可视化解密框架

2026 合肥二手包包回收靠谱门店盘点｜无套路上门回收攻略 - 薛定谔的梨花猫

人机协同采购避坑：只懂聊天不会操作系统的大模型值得采购吗？

EasyLPAC深度解析：3大核心功能助你轻松管理eSIM智能卡

从Delaunay三角剖分到四面体：构建三维世界的几何基石

2026年上海正规犬舍推荐：这5家品牌口碑排名靠前 - 官方资讯

北京黄金回收避坑攻略：认准“秤不改、火不假、价不虚”这三大准测 - 奢侈品回收测评

eNSP - BGP 诊断命令实战指南

MC68HC908LD60同步处理器寄存器详解与视频信号处理实战

联调测试：问题都藏在边界里

云平台

虚拟环境激活

模型下载

vllm推理器下载

启动模型

脚本

微调

相关文章：