当前位置: 首页 > news >正文

Web of Science核心合集文献条目批量导出工具

原文链接:chugit/wos-download-bot-enhanced

WOS Download Bot Enhanced

Web of Science Core Collection 批量导出助手(油猴脚本增强版)

面向 Web of Science 核心合集检索结果页的批量导出工具。
支持暂停 / 继续 / 停止 / 断点续传 / 自动预热 / 中断当前请求,适合大批量文献记录的分批导出。
当前支持导出格式:RIS / BibTeX / TXT


功能特性

  • 支持Web of Science Core Collection结果页批量导出
  • 每批自动导出500 条记录
  • 支持暂停 / 继续 / 停止
  • 支持断点续传
  • 支持页面刷新后恢复任务
  • 支持超大起始条目自动预热
  • 支持中断当前网络请求
  • 自动记录任务进度到localStorage
  • 支持多种排序结果页:
    • relevance
    • recently-added
    • times-cited-descending
    • times-cited-ascending
    • date-descending
    • date-ascending

适用页面

本脚本适用于 Web of Science / Clarivate 的核心合集检索结果页,如:

  • https://*.webofscience.com/wos/woscc/summary/...
  • https://*.clarivate.cn/wos/woscc/summary/...

也就是说,你需要先进入检索结果列表页,脚本才会显示「一键下载」按钮并工作(看不到刷新一下)。

检索结果列表页应从 Web of Science 高级检索(Advanced Search)页面形成,如:

  • https://webofscience.clarivate.cn/wos/woscc/basic-search
  • https://webofscience.clarivate.cn/wos/woscc/advanced-search


安装方法

1. 安装油猴扩展

  • Tampermonkey
  • 篡改猴

2. 安装脚本

将仓库中的脚本文件 wos-download-bot-enhanced.js 导入油猴扩展,或使用Greasy Fork上发布的安装链接。

  • Greasy Fork安装链接

使用方法

基本流程

  1. 打开 Web of Science 核心合集检索结果页
  2. 等待页面加载完成/刷新
  3. 点击右侧“一键下载”
  4. 在弹窗中设置:
    • 文件格式:RIS / BibTeX / TXT
    • 起始条目
    • 下载间隔(秒)
  5. 点击“开始下载”
  6. 脚本会自动按 500 条一批依次导出


下载控制说明

脚本运行后,右侧会显示一个控制台,包含以下操作:

暂停

  • 会在当前批次完成后暂停
  • 不会丢失已完成进度

继续

  • 从上次中断的位置继续下载
  • 适用于:
    • 手动暂停后继续
    • 下载报错后恢复
    • 刷新页面后恢复任务

停止

  • 会尝试中断当前请求
  • 停止后会清空任务记录
  • 下次需要重新开始


断点续传机制

脚本会将当前任务信息保存到浏览器localStorage中,包括:

  • 当前检索结果对应的任务标识
  • 当前排序方式
  • 已完成的导出范围
  • 下一批要下载的范围
  • 任务状态
  • 最近一次错误信息

当你刷新页面,或者重新打开同一个检索结果页时,如果检测到未完成任务,脚本会提示你是否继续。

注意:只有当当前页面的检索结果和排序方式与原任务一致(网址完全相同)时,才允许恢复任务。


预热机制

当起始条目较大时,Web of Science 的接口稳定性通常会下降。
因此脚本加入了预热模式

  • 当起始条目大于 99501
  • 脚本会先从99501附近开始逐批请求进行“预热”
  • 预热阶段不会保存文件
  • 预热完成后,才会跳转到你指定的起始条目开始正式下载

这个机制主要用于提升大范围后段数据导出的稳定性。


参数说明

每批导出数量

固定为:

  • 500 条/批

下载间隔

  • 最低允许:10 秒
  • 默认建议:20 秒
  • 实际运行时会在设定值附近加入少量随机波动,以提高稳定性

起始条目限制

  • 建议不要超过:100000
  • 推荐直接起始的最大值:99501
  • 接口硬上限对应的最大起始条目:199501

如果你的结果量特别大,建议先拆分(如按时间拆分),再分别导出。


文件命名规则

导出的文件名类似:

wos_{sort}_{qid}_{start}-{stop}.{ext}

参考

  • AngelLiang/wos-download-bot
http://www.jsqmd.com/news/527993/

相关文章:

  • Redis String结构详解:从底层原理到实战应用
  • Virtual Display Driver:零成本打造专业多屏环境的终极方案
  • 让大模型用代码说话(非常详细),CodeAct技术原理从入门到精通,收藏这一篇就够了!
  • Go应用内存泄漏排查手册:用pprof抓取heap数据+Graphviz可视化解析
  • Linux dos2unix 命令详解
  • DEAP进化算法框架全攻略:从理论认知到实战应用
  • Git Submodule 在微服务架构中的应用指南,uni-app 模板语法修复说明。
  • 遗产继承律师如何选不踩坑?2026年靠谱推荐处理遗嘱纠纷且经验丰富律师 - 十大品牌推荐
  • 2026年重庆、四川、湖北口碑不错的本地GEO优化品牌企业推荐,专业服务全解析 - 工业品网
  • 模型对比:LiuJuan20260223Zimage v1.0与主流文生图模型在国风题材上的效果差异
  • IP-guard实战指南:即时通讯安全管控全解析
  • Youtu-VL-4B-Instruct惊艳效果展示:手写体+印刷体混合图中分区域OCR+结构化输出
  • Linux网络故障排查指南:从‘Name or service not known‘到畅通无阻
  • 3大维度解析Java智能地址解析:从原理到落地的实践指南
  • MCP3008嵌入式ADC驱动库设计与SPI工程实践
  • string类中基本的知识点
  • 一条命令装好 Oracle 数据库?这个脚本做到了!
  • 深度剖析2026年云贵川地区GEO优化对市场竞争力作用大的靠谱公司 - 工业推荐榜
  • 每日一题3.23——最长稳定连续子数组
  • 8种主流LLM Agents开发框架盘点及MCP Server集成教程,小白程序员必备收藏!
  • 如何通过专注力训练方法改善多动症儿童的冲动行为?
  • 从零到一:打造你的个人智能图像检索系统
  • 2026年汽车贴膜改色价格大揭秘,哈尔滨这些品牌费用合理 - 工业品网
  • 开源工具KMS_VL_ALL_AIO:零基础安全使用与高效激活方案全指南
  • 北京拆迁补偿律师如何选择不踩坑?2026年靠谱推荐房产纠纷处理专业律师团队 - 十大品牌推荐
  • Cogito-V1-Preview-Llama-3B效果实测:对比Claude Code的代码生成能力
  • 2026年哈尔滨汽车贴膜改色选购攻略,靠谱公司怎么选 - 工业推荐榜
  • 细聊哈尔滨隐形车衣优质公司,选购时关注哪些品牌和价格? - mypinpai
  • 基于卷积神经网络思想的Tao-8k视觉描述优化
  • Java Bean数据校验实战指南,Spring——事务的传播性。