当前位置: 首页 > news >正文

利用 One-API 实现 Awesome- GPT( Zotero 插件)的多模型切换

目的:
基于 Zotero 文献库建立个人知识体系,保证 AI 回答在细分专业领域的可靠性。


首先,由于不同模型对文本、数学公式、代码等的解析力不同,我们希望可以得到来自不同模型的、最准确的回答,因此需要一个“管理器”,来管理接入不同模型需要的 api 。采用 OneAPI 实现此步骤。

OneAPI 的 Github 官方网址:https://github.com/songquanpeng/one-api 。

OneAPI 的官方 README 中介绍了不同的部署方式,选择使用 Docker Compose 配置环境,具体步骤如下:

1. 配置环境准备——安装 Docker

win + R 输入 cmd 打开“命令提示符”,输入docker --version检查是否已经安装过,避免后续安装过程中出现冲突。

在浏览器输入 Docker Desktop 官方网址:https://www.docker.com/products/docker-desktop/

下载对应版本的安装包。

按图示勾选并点击OK。

安装成功,关闭窗口。

自动弹出提示,选择接受。

无需登录,跳过即可。

Docker 安装完成时可能同时弹出更新 wsl 的提示,且限时自动关闭。

若 wsl 更新提示关闭,可点击“开始”“终端管理员”,

输入命令 wsl --update 进行更新。

wsl 更新完成。

输入命令 wsl --shutdown 关闭 WSL 服务,以保证再次启动 Docker 时能顺利调用最新的环境。

继续 Docker 安装,尽管已经手动更新 wsl ,如果仍有更新提示,点击 Try Again 即可。

Docker 安装完成。

2. 部署 One-API

接下来可以在 Docker 中配置环境并部署 OneAPI,步骤如下:

新建文件夹(以 D:\Projects\OneAPI 为例),并新建一个文本文档,将其后缀名改为 .yml (以 docker-compose.yml 为例)。

用记事本打开该 .yml 文件,输入以下脚本:

version: '3.8' # Docker Compose 文件版本规范 services: one-api: image: justsong/one-api:latest # 指定镜像名称及标签 (Tag) container_name: one-api-service restart: always # 策略:宿主机重启或程序崩溃时自动重启 ports: - "3000:3000" volumes: - ./data:/data # 将当前目录下的 data 文件夹映射到容器内 environment: - TZ=Asia/Shanghai - NODE_ENV=production logging: # 日志管理,防止日志文件无限增大占用磁盘 driver: "json-file" options: max-size: "10m"

单击文件路径,输入 cmd ,或在文件夹空白处按下 shift + 鼠标右键 ,选择“在此处打开 PowerShell 窗口”,

在当前路径打开 PowerShell 。

输入命令docker-compose up -d

Docker 自动下载镜像并启动服务。

在浏览器输入预设的网址:http://localhost:3000,这就是 OneAPI 的网址。

默认登陆用户名 root ,密码 12356 。

3. 配置模型池

OneAPI 准备完毕,点击 渠道 - 添加新的渠道,填写API Key 等信息即可接入不同模型。

开始配置“模型池”。假设接入 DeepSeek 的模型,步骤为:

打开 DeepSeek 官网,点击 API 开放平台,

新建 API keys,复制并填入 OneAPI。

然而,当我们要接入多家模型时,比如 DeepSeek、阿里、OpenAI,就得去各家官网分别注册、实名认证、充值等,比较麻烦,这时候就需要一个“经销商”,只需注册一次、充值一次,即可“买到”该平台上架的几十种模型,此外,这种平台通过购买大量算力集群并重新分发,往往能提供比官方更便宜且响应更快的接口。

因此,引入“算力分发平台” 硅基流动(SiliconFlow,网址: https://siliconflow.cnhttps://siliconflow.cn//),注册登录。

点击 模型广场 可以看到该平台可提供的所有模型。

完成实名认证可以领取 16 元代金券。需要注意的是,该代金券是在使用模型过程中分次减免的,因此充值时无法直接抵消。

接下来继续配置模型池。点击左侧栏 API 密钥 - 新建 API 密钥 。

复制密钥并粘贴到 OneAPI - 更新渠道信息 - 密钥。

回到 硅基流动 - 模型广场,点击想要添加的模型(以deepseek-ai/deepseek-R1为例),复制其名称,粘贴到 OneAPI - 更新渠道信息 - 模型重定向;

点击其 API文档 ,复制 url ,OneAPI - 更新渠道信息 - 代理,并在其后加上“#”字符。

保持上述信息,回到 OneAPI - 更新渠道信息,按以下图示填写。其中,类型、名称、分组可自定义,为保证 Zotero-GPT 能正确识别, 模型、模型重定向、密钥、代理 需严格按照图示填写。

点击 测试 。测试完成,若状态显示 已启用,响应时间也在合理范围内,则模型已成功接入 OneAPI。

在硅基流动的 费用明细 也能查看到这次测试所消耗 token 对应的金额。

4. 集成到Zotero-GPT

点击 添加新的渠道 ,按照上述步骤可添加新的模型,这里主要对比 DeepSeek-R1、DeepSeek-V3 和 Qwen2.5 三种模型。接下来可以将 OneAPI 这个”枢纽“连接到 Zotero-GPT ,步骤如下:

点击 令牌 - 添加新的令牌 。

名称可自定义,选择 永不过期 、取消无限额度 。

点击 令牌 回到 令牌管理 , 点击 复制 , 获得即将填入 Zotero-GPT 的密钥。

打开 Zotero ,点击导航栏 编辑 - 设置 -(插件)GPT ,按照图示填写。

重复上述步骤以接入由 OneAPI 管理的不同模型。设置完成后,可以在 Model 下拉列表中看到所有可用的模型。

回到 Zotero 主界面,启动 Zotero-GPT 插件,输入问题以测试是否能正常运行。

在 OneAPI 操作日志 页面可以查看所使用的模型类型、消耗的 token 、费用及运行时间等。

在 Docker 后台也能看到运行状况,如有报错可通过查看运行日志来 debug 。

模型效果对比

DeepSeek-R1(deepseek-reasoner)

  1. 验证目标:逻辑严密性与复杂数学/算法推导
  2. 成功指标:
  • 界面显示长达 15s 以上的 思考过程。
  • 输出内容包含严谨的步骤拆解,能够正确识别 MARL 与 CAPTAIN 的耦合点。

DeepSeek-R1 模型表现

DeepSeek-V3 (deepseek-chat)

  1. 验证目标: 长文本摘要、信息提取的吞吐速度与准确性
  2. 成功指标:
  • 响应极快(秒开),终端日志显示响应时间通常在 5s 以内。
  • 表格分类清晰,数据提取无误。

DeepSeek-V3 模型表现

Qwen2.5-72B (qwen-max)

  1. 验证目标:对中国地理环境、特有物种及生态政策的理解力
  2. 成功指标:
  • 对“红线政策”、“澜沧江”等本土词汇理解精准。
  • 建议具有实际的政策参考价值,不悬浮。

Qwen2.5-72B 模型表现

提示

  1. 信息填写:在 One-API 的 渠道 中接入模型时、填写 Awesome-GPT 插件配置信息时,需要仔细核对易错项。
  2. 网址一致:本文 One-API 环境配置脚本中的端口映射网址为 http://localhost:3001 ,若自定义,需保证打开的网址与脚本中的网址一致。
  3. VPN 开关:本文使用国内主流模型,不涉及国外模型,在接入模型或最终问答阶段出现运行停滞,可彻底关闭并退出 VPN 重试。

讨论——溯源

以上操作仅降低了大语言模型回答时产生幻觉的风险,尚无法追溯其回答的论据来源于哪篇文献,有待通过 对文献重新编号、修改提示词 的方法实现精确溯源。

http://www.jsqmd.com/news/759500/

相关文章:

  • 2025届学术党必备的六大AI学术平台推荐
  • 行测申论之外,这些“隐藏”考试内容你知道吗?银保监、外交部等岗位专业课备考指南
  • 新手零代码入门:借助快马AI生成你的第一个有赞式微商城
  • 2026AI商用合规:GPT-Image-2边界解析
  • 别再为电机电感不准发愁了:手把手教你用Simulink复现自适应增益ESO无模型预测控制
  • 2026年企业钓鱼攻击全景报告:AI驱动的“闪电战“与可落地的应急响应SOP
  • 风力发电机输出功率预测建模:算法、影响因素与优化策略深度解析
  • 大模型微调终极指南:从显存优化到高效推理,一文吃透所有核心技术
  • SDQM:无需真实数据的合成质量评估新方法
  • 别再手动烧录MAC了!用STM32F103的UID自动生成局域网唯一设备ID(附完整代码)
  • Sunshine游戏串流终极指南:自托管游戏串流服务器的完整配置与优化
  • 超性感的轻量级openclaw平替,我给nanobot打call
  • 如何用Obsidian Zettelkasten模板实现知识管理的终极升级:从信息收集到智慧创造的完整指南
  • 跨越语言障碍的直播翻译神器:Stream-Translator完全指南
  • Python脚本Shebang最佳实践
  • Laravel 4.x:颠覆PHP框架的10大革新特性
  • 如何用Python构建卡车模拟器的自动驾驶系统?ETS2LA技术深度解析
  • 逆向实战:从汇编到Python,手把手教你调用《魔域》游戏中的技能Call
  • 拿到基因报告先别慌 这五个最常见误读很多人都踩过坑!
  • 【产品底稿 12】工程架构最终定型:完整模块拆分、分包规范、层级依赖与开发规约全清单
  • 浮式海上风力机系统的超螺旋二阶滑模观测最大功率点跟踪【附代码】
  • 保姆级教程:用Python+One-Class SVM给监控视频做‘体检’,快速识别打架、偷窃等异常行为
  • 从航海雷达到MATLAB脚本:TCPA/DCPA计算在船舶智能辅助决策系统中的应用实践
  • llama-cpp-python:本地大语言模型部署的Python桥梁
  • ModTheSpire终极指南:为《杀戮尖塔》打造无限扩展的游戏体验
  • 【人生底稿 20】北上石家庄:从赣州到省会,第一次直面一把手的汇报
  • 利川乡村民宿推荐:投资者决策参考策略深度解析
  • 为开源Agent框架OpenClaw配置Taotoken模型供应商的详细步骤
  • Java面向对象:Student类实战教学
  • 低查重AI写教材的方法,实测8款工具,快速搞定教材编制难题!