当前位置: 首页 > news >正文

deer-flow 2.0部署+调用本地大模型教程(基于vllm)

deer-flow部署+调用本地大模型教程(基于vllm)

部署deer-flow执行流程

拉取最新代码

gitclone https://github.com/bytedance/deer-flow

切换到代码目录

cddeer-flow

配置环境

makeinstall

安装完成后执行:

makecheck

显示如下:

配置启动配置文件

makeconfig

执行完会在根目录生成config.yaml文件

修改配置文件

将config.yaml中models部分替换成自己部署的模型

models: - name: local-vllm display_name: Local vLLM use: langchain_openai:ChatOpenAI model: qwen3 api_key: dummy_key base_url: http://<your-vllm-host>:<port>/v1

启动服务

makestart

启动成功显示如下:

vllm部署本地大模型

以qwen3-8B 为例,显存占用44G

执行流程

安装vllm

pipinstall-Uvllm\--pre\--extra-index-url https://wheels.vllm.ai/nightly

下载qwen3-8B模型

exportHF_ENDPOINT=https://hf-mirror.com huggingface-cli download --resume-download Qwen/Qwen3-8B --local-dir qwen3

注意–local-dir名字和后面的服务启动,deer-flow配置相关!!!

启动服务

vllm serve qwen3--port8866--max_model_len16384--reasoning-parser deepseek_r1 --enable-auto-tool-choice --tool-call-parser hermes

注意–max_model_len 必须设置,否则在deer-flow调用时会报400:bad request

部署完并调用成功界面如下

如有疑问,欢迎评论区交流

http://www.jsqmd.com/news/580793/

相关文章:

  • 2026年3月必看!混凝土生产厂推荐里的优质之选,国内混凝土厂家深度剖析助力明智之选 - 品牌推荐师
  • initramfs与rootfs 启动衔接
  • 论文答辩前AI率高的同学,这几个工具能救急 - 我要发一区
  • ADM7150ACPZ-3.3-R7是一款具备 800mA 电流输出能力的超低噪声线性稳压器
  • 番茄小说下载器完整指南:3步永久保存你喜欢的网络小说
  • Windows热键冲突终结指南:3分钟快速定位占用程序的终极方案
  • 实战应用:基于快马ai为全栈项目快速构建集成wsl2开发环境
  • Qwen3-14B-Int4-AWQ在嵌入式开发中的应用:STM32F103C8T6项目文档自动生成
  • 破茧成蝶:Java后端从0到资深工程师的进阶之路(六)
  • Python自动化抢票实战:告别手动抢票,用技术提升成功率
  • intv_ai_mk11镜像免配置价值:节省开发者平均8.2小时/人环境搭建时间实证
  • 万象视界灵坛代码实例:Python调用CLIP-ViT-L/14提取图像文本嵌入向量
  • 解放双手:鸣潮自动化工具的智能革命与实践指南
  • 专业的哈尔滨聚合氯化铝知名厂家
  • 30分钟搭建你的AI视觉导师:零代码部署交互式CNN学习平台
  • 沃尔玛购物卡还能回收?简单方法助你快速变现! - 团团收购物卡回收
  • 数据仓库性能优化:聚合策略设计与查询加速实战指南
  • Switch手柄PC适配问题解决方案:从驱动安装到高级功能配置的实战指南
  • 吃韭菜和鳊鱼也会春天出鼻血,是太发了吗?到底什么原因?如何解决?
  • 深圳华建净净化工程技术探讨-洁净厂房选址、布局与建设核心技术规范
  • 高效掌握流媒体下载与直播录制:N_m3u8DL-RE全功能技术指南
  • Windows 11 24H2 LTSC 微软商店一键安装完整指南:3分钟恢复完整应用生态
  • 音乐文件格式转换工具QMCDUMP深度探索:从加密困境到自由播放
  • 企业级多语本地化工具落地:Pixel Language Portal生产环境部署详解
  • 长春洗浴设计企业市场排名
  • 高股息成避风港,红利低波ETF华夏(159547)震荡市显韧性
  • 激光雷达点云处理掉帧率高达17%?用C++20协程重写感知pipeline后,端到端延迟压至21.3ms(实车路测原始日志验证)
  • 矢量到像素的无缝过渡:Ai2Psd效率工具解决方案
  • 5步解锁Windows隐藏性能:RyTuneX系统优化实战指南
  • 科创芯片ETF(589100)大涨超3.5%,AI+涨价潮点燃芯片景气