当前位置：首页 > news >正文

随笔——将 Zotero 接入 DeepSeek，实现 AI 赋能的文献阅读工作流

news 2026/7/28 3:21:52

从零到一：将 Zotero 接入 DeepSeek，打造 AI 赋能的文献阅读工作流（含本地部署方案）

告别低效的精读，让 AI 帮你提炼核心、挖掘研究空白，同时自由选择云端或本地推理。

作为科研党，我们每天都要面对海量的文献。逐字逐句地阅读不仅耗时，还容易陷入“读了后面忘了前面”的困境。如果能有一个 AI 助手，随时帮你总结、翻译、甚至批判性地分析论文，那该多好？

今天，手把手教你如何将Zotero（文献管理神器）与DeepSeek（高性价比大模型）连接起来，并提供云端嵌入服务和完全本地化（Ollama）两种方案。

一、准备工作：安装必备插件与获取 API（云端方案）

1.1 安装 Awesome GPT 插件

Awesome GPT 是目前 Zotero 生态中最强大的 AI 整合插件，支持自定义 API、嵌入模型、文献批量分析等功能。

确保你的 Zotero 版本 ≥ 7.0（推荐最新版）
从 Zotero 中文插件商店下载Awesome GPT的.xpi文件
在 Zotero 中点击工具→插件→Install Add-on From File...，选择下载的.xpi文件，安装后重启 Zotero

1.2 获取 DeepSeek API Key（用于对话/摘要）

DeepSeek 性价比高，入门较简单，非常适合日常使用。

访问 DeepSeek 开放平台，注册/登录
进入API Keys页面，点击创建 API Key
复制生成的密钥（以sk-开头），保存好，后续不再显示

1.3 获取硅基流动 API Key + 代金券（用于向量嵌入）

DeepSeek 官方不支持文本向量化（Embedding），我们需要另一个服务来为 PDF 的“AskPDF”功能提供支持。这里推荐硅基流动（SiliconFlow），新用户有 16 元认证代金券，足够处理海量文献。

访问硅基流动官网，注册账号。
完成实名认证（需要身份证，用于领取代金券）。
进入活动中心，领取“认证专享礼” 。
进入 API 密钥页面，点击“新建 API 密钥”，起名后复制保存。
关键一步：为了激活代金券自动抵扣，建议先充值1元（或者其他金额）（账户管理 → 余额充值）。

二、核心配置：将 Zotero 连接到 DeepSeek + 硅基流动（云端方案）

2.1 打开 Awesome GPT 设置界面

在 Zotero 中，点击编辑→设置→ 找到GPT或Awesome GPT标签页。

2.2 配置对话模型（General 区域）

配置项	填入内容	说明
Base API	`https://api.deepseek.com`	DeepSeek 官方接口地址
API Key	`sk-xxxxxxxxxx`	你从 DeepSeek 平台复制的密钥
Model	`deepseek-chat`	DeepSeek 对话模型名称
Temperature	`1`	保持默认，控制随机性
Max Tokens	`4096`	单次回复最大长度，可根据需要调整

2.3 配置向量嵌入模型（Custom Embedding 区域）

这一步用于启用AskPDF、Literature Review等需要理解全文的功能。

勾选Using custom embeddings
填写以下内容：

配置项	填入内容	说明
Full API	`https://api.siliconflow.cn/v1/embeddings`	硅基流动的嵌入接口
Key	`sk-xxxxxxxxxx`	硅基流动的 API Key
Model	`BAAI/bge-m3`	高性能开源嵌入模型
Batch Size	`50`	可保留默认，如遇超时可降至 20

2.4 测试连接

点击设置界面右下角的Test按钮。你应该看到类似下面的输出：

POST https://api.deepseek.com/v1/chat/completions POST https://api.siliconflow.cn/v1/embeddings Normal, used 4.291s

如果看到Normal，恭喜你，云端配置成功！

如果 Embeddings 测试返回 404，说明 DeepSeek 不支持嵌入，请确保已勾选Using custom embeddings并正确填写硅基流动的接口。

三、完全本地化方案（Ollama）—— 零隐私泄露，零网络依赖

如果你对数据隐私有极高要求，或者希望完全摆脱 API 费用和网络限制，可以使用Ollama在本地运行大模型和嵌入模型。虽然需要一定的硬件配置，但一旦部署完成，响应速度非常快，且完全免费。

3.1 硬件要求

模型	内存需求	推荐配置
`deepseek-r1:7b`(对话)	~8GB	16GB 内存 + 4GB 显存（或纯 CPU 运行）
`nomic-embed-text`(嵌入)	~2GB	8GB 内存即可

纯 CPU 运行：速度较慢（约 5-10 token/秒），但可用。
GPU 加速：建议 NVIDIA 显卡，6GB 显存以上可获得流畅体验。

3.2 安装 Ollama

访问 Ollama 官网，下载对应操作系统的安装包（Windows / macOS / Linux）
安装完成后，Ollama 会自动启动后台服务（可在任务栏或系统托盘找到图标）

3.3 下载所需模型

打开终端（Windows 用户可使用cmd或 PowerShell，Mac/Linux 用户使用 Terminal），依次执行以下命令：

# 下载嵌入模型（体积小，速度快）ollama pull nomic-embed-text# 下载 DeepSeek 对话模型（7B 版本，平衡性能与资源）ollama pull deepseek-r1:7b

你也可以选择其他模型，如llama3.2:3b（更轻量）或qwen2.5:7b（中文更强）。模型名称可在 Ollama 模型库查询。

下载过程取决于网络速度，模型文件通常为 4-8 GB，请耐心等待。

3.4 验证模型是否正常运行

在终端中输入：

ollama list

应该能看到deepseek-r1:7b和nomic-embed-text两个模型。

然后测试对话模型：

ollama run deepseek-r1:7b"Hello, introduce yourself."

如果能得到回复，说明模型工作正常。按Ctrl + D退出对话。

3.5 配置 Awesome GPT 使用本地模型

保持 Ollama 后台运行（无需额外操作）。打开 Zotero 的 Awesome GPT 设置界面：

聊天模型配置（General 区域）

配置项	填入内容	说明
Base API	`http://localhost:11434/v1`	Ollama 默认 API 地址
API Key	`ollama`	任意非空字符串即可，Ollama 不验证
Model	`deepseek-r1:7b`	必须与`ollama pull`的模型名完全一致
Temperature	`0.7`	可适当降低以获得更确定性的回答
Max Tokens	`2048`	本地模型显存有限，可保守设置

向量嵌入模型配置（Custom Embedding 区域）

勾选Using custom embeddings
填写以下内容：

配置项	填入内容
Full API	`http://localhost:11434/v1/embeddings`
Key	`ollama`
Model	`nomic-embed-text`
Batch Size	`20`（本地建议调低，避免超时）

3.6 测试连接

点击设置界面的Test按钮。输出应类似：

POST http://localhost:11434/v1/chat/completions POST http://localhost:11434/v1/embeddings Normal, used 1.203s

如果看到Normal，恭喜！你的 Zotero 已经完全运行在本地 AI 之上了。

常见问题：
如果测试chat/completions返回connection refused，请确认 Ollama 是否在后台运行（任务栏图标或命令行输入ollama serve）。
如果embeddings测试失败，检查模型名是否为nomic-embed-text（注意不是nomic-embed-text:latest）。

四、实战：在 Zotero 中用 AI 阅读文献（通用操作）

无论你使用云端方案还是本地方案，Zotero 中的 AI 操作完全一致。

4.1 召唤 AI 助手

快捷键：Ctrl + /（Windows）或Cmd + /（Mac）
一个悬浮对话框会出现在 PDF 阅读界面旁边，支持连续对话、Markdown 格式回复
如果想清空对话历史，在输入框输入/clear即可

4.2 核心功能一：AskPDF —— 一键全文摘要

这是最常用的功能。打开一篇 PDF 后，在悬浮 AI 对话框中点击“AskPDF”按钮。

AI 会自动读取全文，生成包含以下要点的摘要：

研究背景与问题
使用的方法
主要结果
结论与意义

示例输出：

本文研究了…… 采用……方法，发现……。这一发现对……领域具有……意义。

从此，5 分钟即可“读完”一篇 20 页的论文，快速筛选哪些值得精读。

4.3 核心功能二：Literature Review —— 多篇文献自动综述

当你需要整合多篇相关文献时，这个功能是神器。

在 Zotero 主文献列表中，按住Ctrl（Mac：Cmd）多选 2 篇及以上的文献
在 AI 对话框中点击“Literature Review”
插件会自动：
- 提取每篇文献的标题、摘要、方法、结论
- 交叉比较，找出共同主题和矛盾点
- 自动识别研究空白（Research Gap）
- 生成综述初稿，可直接复制到 Word 中继续修改

小技巧：可以先用 AskPDF 快速筛选出 5-8 篇高度相关的论文，再用 Literature Review 深度整合。

4.4 进阶提问：让 AI 扮演不同角色

除了预设按钮，你还可以直接输入指令，让 AI 以特定角色回答问题。以下是一些非常实用的提示词：

场景	提示词示例
翻译校对	“请将以下段落翻译成中文，并检查语法和逻辑问题。”
批判性思考	“请从一个审稿人的角度，指出本研究的局限性及改进建议。”
实验设计	“基于本文的假设，设计一个可行的后续实验方案。”
概念类比	“请为本文提出的 XX 机制找一个日常生活中的类比，帮助理解。”
代码复现	“请根据本文的方法部分，生成 Python 伪代码实现核心算法。”

4.5 与笔记插件联动（可选，但强烈推荐）

为了让 AI 的产出沉淀为你自己的知识库，建议搭配以下插件：

Better Notes：可将 AI 回复一键转为结构化笔记，支持双向链接
Zotcard：卡片式笔记，适合原子化记录
Translate for Zotero：划词翻译，方便阅读非母语文献

操作示例：
在 AI 对话框得到摘要后，右键点击输出 →Save to Better Notes，自动创建一篇带有文献元数据的笔记。

五、云端 vs 本地：如何选择？

对比维度	云端方案（DeepSeek + 硅基流动）	本地方案（Ollama）
硬件要求	无（仅需网络）	至少 8GB 内存，推荐 16GB + GPU
成本	DeepSeek 约 1 元/百万 token，硅基流动有 16 元代金券	完全免费（电费忽略）
数据隐私	数据上传至第三方服务器	数据完全留在本地
网络依赖	必须联网	可完全离线
响应速度	取决于网络，通常 2-5 秒	取决于硬件，GPU 下 1-2 秒
中文效果	极好（DeepSeek 原生中文）	较好（deepseek-r1:7b 中文能力稍弱于云端版）
模型灵活性	固定模型（deepseek-chat, BAAI/bge-m3）	可任意更换 Ollama 支持的模型

建议：

新手/硬件一般：先用云端方案，零成本体验全部功能。
隐私敏感/网络差/爱折腾：尝试本地方案，一次部署长期受益。
混合使用：你可以同时配置两套，在设置中切换 Base API 即可。

六、常见问题与解决

Q1：测试 Embeddings 时返回 404？

云端方案：确保已勾选Using custom embeddings，且 Full API 为https://api.siliconflow.cn/v1/embeddings（末尾不要多/）。
本地方案：确认 Ollama 已下载nomic-embed-text模型（ollama list查看），且 Full API 为http://localhost:11434/v1/embeddings。