当前位置: 首页 > news >正文

[T.17] 团队项目:Scider Beta 阶段发布说明

这个作业属于哪个课程 北航2026年春季软件工程
这个作业的要求在哪里 [T.17] 团队项目:Beta 阶段发布说明
我在这个课程的目标是 体验完整软件开发流程,交付一款真正解决科研阅读痛点的软件产品
这个作业在哪个具体方面帮助我实现目标 完成 Beta 阶段发布说明

Scider 是一个智能学术论文管理辅助平台,面向科研人员与学生,提供论文检索、AI 解析、知识图谱可视化与个人文库管理等功能。

Beta 版本现已上线,在 Alpha 版本核心功能的基础上,新增了 PDF 内文字搜索、连续滚动浏览、文本高亮批注、要点对照阅读、富文本笔记、笔记导出、笔记与 PDF 联动、LLM 自动图结构生成与聚类、图谱编辑、AI 问答助手等丰富功能,所有核心功能均可免费使用,期待您的使用反馈!

  • 在线体验:http://39.107.252.200
  • 宣传网页:https://www.cnblogs.com/BBnomoney/p/20542987

1. 新功能和特性

1.1 PDF 内文字搜索

实现需求

在 PDF 阅读界面中,支持用户输入关键词搜索当前论文全文,高亮显示所有匹配位置,并支持在结果列表间逐条跳转。

应用场景

研一新生张同学正在阅读一篇关于 Transformer 的论文,想快速找到文中所有出现"attention mechanism"的位置。他在 PDF 阅读器的搜索框中输入关键词,系统立刻高亮显示所有匹配位置,并支持逐条跳转,几分钟内就完成了原本需要半小时的翻阅工作。

1.2 连续滚动浏览与页码定位

实现需求

PDF 阅读模式由逐页翻页改为垂直连续滚动浏览,切换页面时缩放比例保持不变;支持在页码输入框中输入目标页码,自动滚动到该页并将其定位在阅读界面视图中央。

应用场景

张同学在阅读一篇 30 页的论文时,导师建议他重点看第 15 页的实验部分。他在页码输入框中键入"15",PDF 立即滚动到该页并居中显示,全程不到一秒,阅读体验流畅连贯。

1.3 要点对照阅读

实现需求

在 PDF 阅读界面的右侧边栏中,并排显示 LLM 提取的四要素关键点(研究背景、研究方法、创新点、研究结论),实现正文阅读与核心要点的同步对照。

应用场景

张同学在阅读论文正文时,右侧边栏始终展示着 AI 提取的四要素。当他读到方法部分时,可以随时对照右侧的"研究方法"摘要,确认自己的理解是否正确,阅读与理解同步进行,效率大幅提升。

1.4 笔记列表与全文搜索

实现需求

每篇论文下支持创建多篇笔记,笔记按论文归集管理。

应用场景

张同学在阅读一篇论文时,边读边记录了多篇笔记,全部挂载在同一篇论文下。几天后回顾时,直接在论文详情页展开笔记列表,所有笔记按时间倒序排列,标题清晰展示,点击即看,围绕同一篇论文归集,不会与其他论文混淆,知识脉络一目了然。

1.5 富文本编辑器

实现需求

笔记编辑器支持 Markdown 语法渲染、LaTeX 数学公式(通过 katex 扩展)、图片粘贴自动上传至后端。

应用场景

张同学在记录一篇机器学习论文的笔记时,需要写下公式 $L(\theta) = -\mathbb{E}_{x \sim p}[\log p_\theta(x)]$。在富文本编辑器中输入 LaTeX 语法后,公式实时渲染为漂亮的数学表达式,同时他还粘贴了一张模型架构图,图片自动上传并嵌入笔记中。

1.6 笔记导出

实现需求

支持将笔记导出为 Markdown、TXT 或 PDF 格式的文件,方便用户在不同平台间迁移和使用笔记内容。

应用场景

张同学完成了文献调研,需要将所有论文笔记整理成一份综述报告。他选择将相关笔记导出为 PDF 格式,一键下载后直接作为报告附件提交给导师。

1.7 LLM 自动图结构生成与聚类

实现需求

基于文库中已确认的论文集合,调用大语言模型自动分析并生成图结构,包含基于研究主题/领域的自动聚类展示,以不同颜色区分不同研究簇。

应用场景

张同学上传了 5 篇关于"对比学习"的论文并确认了四要素。点击"生成图谱"后,系统自动将论文按"图像对比学习"、"文本对比学习"、"多模态对比学习"等主题聚类,不同颜色区分不同研究簇。张同学一眼看出该领域的研究热点分布,并发现了两个交叉方向的研究空白。

1.8 图谱编辑功能

实现需求

支持手动添加/删除节点、编辑节点属性、建立或删除节点间关系;删除节点时自动删除与该节点关联的所有边。

应用场景

张同学发现 AI 将一篇关于"CLIP"的论文误分到了"文本对比学习"簇,而实际上它应该属于"多模态对比学习"。他拖拽该节点到正确的簇中,并手动添加了一条与另一篇多模态论文的关联边,知识图谱更加准确,完全符合他的研究认知。

1.9 图谱导出

实现需求

支持将当前知识图谱视图导出为 PNG 或 SVG 格式的图片。

应用场景

张同学完成文献调研后,将整理好的知识图谱导出为 PNG 图片,插入到组会汇报的 PPT 中,清晰地展示了领域研究脉络,获得了导师的表扬。

1.10 AI 问答助手(PDF 场景)

实现需求

在 PDF 阅读界面,允许用户输入自然语言问题,系统基于当前论文全文及用户笔记内容,通过 RAG(检索增强生成)流程返回回答。

应用场景

张同学读到一篇 40 页的论文,对"对比损失函数的温度参数为什么选择 0.07"感到困惑。他在 AI 问答框中输入这个问题,系统基于论文全文生成了详细的回答,并引用了原文中的相关论述,张同学立刻理解了设计者的考量,省去了反复翻找的时间。

1.11 AI 问答助手(知识图谱场景)

实现需求

在知识图谱界面,允许用户输入自然语言问题,系统基于当前生成图谱内容与论文关联信息返回回答。

### 应用场景

张同学看着生成的对比学习知识图谱,在问答框中输入"这个领域的主要研究方向有哪些?"系统分析图谱结构后回答:"主要分为图像对比学习、文本对比学习、多模态对比学习三个方向,其中文本对比学习方向最近两年发文量增长最快。..."知识图谱的价值被自然语言交互进一步放大。

2. 修复的缺陷

2.1 图谱交互修复

原有问题:Alpha 版本中,知识图谱在拖动节点时,信息弹窗与节点发生位置偏移,弹窗没有跟随节点移动。用户在拖拽整理图谱时,弹窗与节点分离,导致信息展示错乱,严重影响图谱的可读性和操作体验。

修复方式:重构弹窗定位逻辑,使用相对 Canvas 坐标定位,通过 getBoundingClientRect 计算节点位置并实时更新;绑定拖拽事件连续更新位置,结合 requestAnimationFrame 优化定位计算。新版本中弹窗紧密跟随节点移动,拖拽体验流畅精准。

2.2 上传流程中断修复

原有问题:上传重复 PDF 后,上传流程未能正确终止,前端 UI 状态未清理。用户误传重复文件后,界面仍显示"上传中"状态,无法继续操作,需要刷新页面才能恢复。

修复方式:前端使用 Pinia 管理上传状态,在组件 onUnmounted 中调用 uploadStore.clearState() 并执行 abortController?.abort()。后端 MD5 检测机制复用,重复文件上传时立即返回提示并清理前端状态。新版本中重复上传会明确提示"文件已存在",界面状态正常。

2.3 筛选逻辑修复

原有问题:"最近论文"筛选导致语义关联连线消失,力导向图的边数据绑定异常。用户切换筛选条件后,图谱中的论文节点之间的连线丢失,无法看到论文间的关联关系。

修复方式:采用 D3 的"enter-update-exit"模式重构力导向图边数据绑定,筛选后先清空旧边再绑定新数据集,确保无残留连线。新版本中切换筛选条件时,图谱节点和边的数据同步更新,关联关系始终可见。

2.4 前端单元测试补全

原有问题:Alpha 阶段前端缺乏系统性的单元测试,关键 Vue 组件(PDF 预览组件、知识图谱可视化组件、登录注册组件)的交互逻辑与渲染完整性未经自动化验证,存在潜在回归风险。

修复方式:使用 Vitest + Vue Test Utils 编写前端单元测试,Mock API 时使用 vi.mock 模拟 api/ 目录下的模块,异步组件测试配合 flushPromises 等待状态更新完成。

2.5 后端 API 集成测试补全

原有问题:Alpha 阶段后端 API 缺乏系统性集成测试,密码重置、JWT 刷新、LLM 图结构生成等关键接口的正确性依赖于人工验证。

修复方式:使用 pytest.mark.asyncio 装饰异步测试函数,通过 httpx.AsyncClient 发起请求,Mock 外部依赖时使用 AsyncMock

3. 运行环境

本平台 Beta 阶段为 Web 应用,用户无需安装任何客户端软件,通过浏览器即可访问全部功能。

运行环境

操作系统 浏览器及版本
macOS 14+ Chrome 120+、Safari 17+、Firefox 120+、Edge 120+
Windows 10/11 Chrome 120+、Firefox 120+、Edge 120+
Ubuntu 22.04 LTS Chrome 120+

最低运行要求

  • 浏览器需启用 JavaScript
  • 屏幕分辨率不低于 1366×768(推荐 1920×1080)
  • 需要能够正常访问以下域名:
    • api.semanticscholar.org(论文检索)
    • dashscope.aliyuncs.com(阿里云通义千问 API)

4. 安装与使用方法

访问方式

本软件为 Web 应用,无需安装。直接在浏览器地址栏输入 http://39.107.252.200 即可访问。

注册方式

平台支持用户自行注册:

  • 访问首页,点击右上角"开始使用"按钮
  • 填写邮箱地址和密码(密码不少于 6 位)
  • 点击"注册"完成账号创建

新用户入门流程

  1. 注册登录:使用邮箱和密码注册账号并登录系统
  2. 建立文库:进入"我的文库",创建文件夹搭建个人文献分类结构
  3. 上传论文:点击"上传 PDF"按钮,选择或拖拽 PDF 文件,等待后台解析
  4. 确认四要素:解析完成后点击论文卡片,在抽屉中查看并确认 AI 提取的四要素内容
  5. 探索知识图谱:上传多篇并确认状态的论文后,进入"知识图谱"页面生成图谱并交互探索

进阶功能

  • PDF 内搜索:在 PDF 阅读器中输入关键词,高亮定位全文匹配位置
  • 文本高亮批注:选中 PDF 中的文字进行高亮标记,标注永久保存
  • 添加富文本笔记:在论文预览界面中点击"笔记"标签,支持 Markdown 和 LaTeX 公式
  • 笔记与 PDF 联动:点击笔记中的批注标记,自动跳转到 PDF 对应位置
  • AI 问答:在 PDF 阅读界面或知识图谱界面,输入自然语言问题获取智能回答
  • 图谱导出:将知识图谱导出为 PNG 或 SVG 图片

5. 系统已知的问题和限制

已知问题

富文本编辑器在 Safari 浏览器中图片粘贴偶现失败

  • 表现:使用 Safari 浏览器粘贴图片到笔记编辑器时,偶现上传失败
  • 触发条件:Safari 浏览器版本较旧或系统权限限制
  • 缓解方法:建议使用 Chrome 或 Edge 浏览器;或通过"上传图片"按钮代替粘贴

AI 四要素提取解析偶有偏差

  • 表现:部分论文的 AI 提取内容存在不准确或信息不完整的情况
  • 触发条件:论文格式不规范(如双栏排版、扫描件)或内容高度专业化
  • 预计修复:持续优化 Prompt 工程与模型选择

功能限制

限制项 说明
单文件上传上限 50MB,超大型综述论文建议先压缩后上传
并发上传 同时上传 PDF 数量不超过 5 个,避免 Celery 任务队列积压
笔记长度 单篇笔记建议不超过 10000 字,过长内容可能影响编辑器性能
AI 问答频率 受限于 LLM API 调用配额,建议合理控制问答频次
离线模式 论文搜索、AI 解析、知识图谱等核心功能依赖外部 API,无网络环境下仅可查看已上传的论文和笔记
数据批量导出 暂不支持批量导出论文元数据或笔记,后续版本计划加入
文件夹层级 当前仅支持单级文件夹操作,不支持嵌套子文件夹

6. 软件发布方式与发布地址

在线体验

直接在浏览器中访问 http://39.107.252.200 即可使用全部功能,无需安装任何软件。

宣传网页

Scider 项目宣传网页:https://www.cnblogs.com/BBnomoney/p/20542987

开源仓库

Scider 完全开源,可通过 GitHub 获取源码并自行部署:

git clone https://github.com/XiaCang/Scider.git

GitHub 仓库地址:https://github.com/XiaCang/Scider

团队博客

团队博客:https://www.cnblogs.com/BBnomoney

Scider —— 让学术阅读变得高效而深刻。

欢迎访问 http://39.107.252.200 体验 Beta 版本,也欢迎通过 GitHub Issue 或博客留言给我们反馈!

http://www.jsqmd.com/news/1056323/

相关文章:

  • 从68K到PowerPC:嵌入式系统架构迁移实战与避坑指南
  • ETPU鞋材供应商推荐排行:2026实力口碑榜单,选对供应商不踩坑 - 速递信息
  • 如何高效获取网盘直链:终极下载加速秘籍
  • 安徽企业AI精准获客实操:2026本地GEO优化公司推荐与分行业选型指南 - 936品牌测评网
  • 跨越图形API鸿沟:DXVK如何让Windows游戏在Linux上流畅运行
  • D3KeyHelper:暗黑3玩家的5个高效自动化技巧,轻松解放双手!
  • 2026淮北高三滑档有出路,公办高职复读备战单招 - cc江江
  • 2026年儿童练字避坑指南:怎样用一对一私教课打破选择困局? - 品牌报告
  • 2026佛山钻石回收调研,六大主流机构资质报价对比实测 - 讯息早知道
  • 2026武汉营业性演出许可证一站式整套代办推荐 - 速递信息
  • 致歉声明登报怎么线上办理?2026干货分享! - 速递信息
  • 【无人机三维路径规划】蒲公英算法DO复杂地形无人机避障三维航迹规划【含Matlab源码 15649期】
  • 2026-06-19 闲话
  • 3分钟快速安装:Android Studio中文界面完整配置终极指南
  • 2026年6月新鲜爆料|格拉苏蒂官方正规授权维保资质服务机构杭州站点服务全攻略,走时故障一文读懂 - 亨得利官方售后
  • 从零搭建Pikachu靶场:深入实战越权漏洞原理与防御
  • ServletContextListener本质与生产级实践指南
  • 2026黄山全市落榜生均可报名,公办单招复读班火热抢占名额 - cc江江
  • 山东济南猎头公司前十名及联系电话 - 榜单推荐
  • i.MX28汽车级SoC硬件设计与软件调试实战指南
  • 营业执照副本丢了登报声明怎么线上办理?2026干货分享! - 速递信息
  • 指令式VLM代码解释
  • 2026深圳黄金回收实测榜单:老牌连锁无损验金 - 讯息早知道
  • 2026年6月前沿速报|帝舵官方正规授权维保资质服务机构上海站点全流程解读,走时故障一文搞定 - 亨得利官方售后
  • 汽车电子仪表盘硬件设计:基于MPC5606S的电源、显示与EMC实战解析
  • 合肥市蜀山区井岗镇生日宴小宴席实测,这家综合体验领跑 - 速递信息
  • Go 与 Rust 并发:实战中的选择
  • 缠论自动化分析插件:如何让通达信5分钟完成专业级缠论分析?
  • WarcraftHelper:魔兽争霸III现代化体验终极指南
  • Ubuntu 20.04 下 Nginx 安装配置与 systemd/ufw 深度解析