当前位置：首页 > news >正文

计算机毕业设计Django+大模型中华古诗词知识图谱可视化古诗词智能问答系统古诗词数据分析古诗词情感分析模型自然语言处理NLP 机器学习深度学习

news 2026/3/26 19:52:47

温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！
温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！
温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！

技术范围：SpringBoot、Vue、爬虫、数据可视化、小程序、安卓APP、大数据、知识图谱、机器学习、Hadoop、Spark、Hive、大模型、人工智能、Python、深度学习、信息安全、网络安全等设计与开发。
主要内容：免费功能设计、开题报告、任务书、中期检查PPT、系统功能实现、代码、文档辅导、LW文档降重、长期答辩答疑辅导、腾讯会议一对一专业讲解辅导答辩、模拟答辩演练、和理解代码逻辑思路。
🍅文末获取源码联系🍅
🍅文末获取源码联系🍅
🍅文末获取源码联系🍅
感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及LW文档编写等相关问题都可以给我留言咨询，希望帮助更多的人

信息安全/网络安全大模型、大数据、深度学习领域中科院硕士在读，所有源码均一手开发！

感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人

介绍资料

任务书：Django + 大模型中华古诗词知识图谱可视化系统

一、项目背景与目标

中华古诗词是中华文化的重要载体，蕴含丰富的历史、哲学与美学价值。然而，传统诗词数据库多以文本检索为主，缺乏对诗词间关联关系的深度挖掘与可视化展示。本项目旨在结合Django框架与大语言模型（LLM）技术，构建一个交互式古诗词知识图谱可视化系统，实现以下目标：

知识抽取与关联：利用大模型（如LLaMA、Qwen）自动提取诗词中的实体（如作者、朝代、意象、典故）及关系，构建结构化知识图谱。
可视化探索：通过图数据库（Neo4j）与前端技术（D3.js/ECharts）展示诗词间的隐含关联（如“李白→《静夜思》→月亮意象→中秋典故”）。
智能检索与推荐：支持自然语言查询（如“描写边塞的唐诗”），并基于图谱推荐相关诗词或文化背景知识。
文化教育应用：为学者、学生提供诗词研究工具，辅助理解诗词意境与历史脉络。

二、项目范围与功能

1. 系统核心功能

知识图谱构建模块：
- 数据采集：爬取公开诗词数据集（如“全唐诗”“全宋词”）、权威注释文献。
- 实体识别与关系抽取：
  - 使用大模型（如ChatGLM、InternLM）标注诗词中的实体（人物、地点、意象）及关系（创作时间、主题关联、典故引用）。
  - 人工校验关键实体（如争议性历史人物），确保知识准确性。
- 图谱存储：将结构化数据导入Neo4j图数据库，支持高效关系查询。
可视化交互模块：
- 动态图展示：基于D3.js或ECharts实现诗词节点的力导向图布局，支持缩放、拖拽、高亮关联路径。
- 多维度筛选：按朝代、作者、主题（如“送别”“思乡”）过滤图谱节点。
- 路径探索：展示诗词间的关联路径（如“王维→山水诗→孟浩然→田园诗”）。
智能检索与推荐模块：
- 自然语言查询：用户输入口语化问题（如“苏轼写过哪些关于西湖的诗？”），系统解析意图并返回图谱结果。
- 相似诗词推荐：基于嵌入模型（如Sentence-BERT）计算诗词语义相似度，推荐风格或主题相近的作品。
后台管理模块（Django Admin）：
- 管理员可上传新诗词数据、修正图谱关系、监控系统日志。

2. 技术栈

后端框架：Django 4.0+（RESTful API开发）
大模型服务：Hugging Face Transformers（本地部署轻量化模型）、LangChain（查询解析）
图数据库：Neo4j 5.0+（存储知识图谱）
前端可视化：D3.js（动态图） + ECharts（统计图表） + Vue.js（交互界面）
数据爬取：Scrapy（诗词文本） + BeautifulSoup（注释解析）
部署环境：Docker（容器化） + Nginx（Web服务器）

三、项目实施计划

阶段1：需求分析与数据准备（2周）

调研用户需求（学者、学生、文化爱好者），明确核心功能优先级。
爬取诗词文本及注释数据（如“古诗文网”“中国哲学书电子化计划”），存储至MySQL数据库。
搭建Django基础框架，配置Neo4j图数据库连接。

阶段2：知识图谱构建（4周）

实体识别：
- 使用Prompt Engineering优化大模型，提取诗词中的实体（如“《将进酒》→作者：李白→朝代：唐”）。
- 标注1000首诗词作为训练集，微调轻量级模型（如Alpaca）提升准确率。
关系抽取：
- 定义关系类型（如“创作”“引用”“主题关联”），通过大模型生成三元组（如“《静夜思》-主题-思乡”）。
图谱导入：将三元组批量导入Neo4j，构建初始图谱。

阶段3：可视化与智能功能开发（5周）

前端开发：
- 使用Vue.js搭建单页应用（SPA），集成D3.js实现动态图渲染。
- 开发查询输入框、筛选面板、节点详情弹窗等组件。
智能检索：
- 基于LangChain解析用户查询意图，转换为Cypher查询语句（如“找出所有描写战争的宋词”）。
- 实现相似诗词推荐API，调用嵌入模型计算余弦相似度。
测试与优化：
- 单元测试：验证知识抽取准确率（目标>90%）、查询响应时间（<2秒）。
- 用户测试：邀请目标用户体验原型系统，收集反馈调整交互设计。

阶段4：部署与文档编写（2周）

使用Docker打包Django后端、Neo4j数据库与前端静态文件。
编写《系统使用手册》《API文档》《数据来源说明》。
部署至云服务器（如阿里云ECS），配置域名与HTTPS证书。

四、预期成果

在线系统：可公开访问的古诗词知识图谱平台（如http://poetry-graph.example.com）。
知识图谱数据：包含5万+诗词节点、10万+关系边的Neo4j数据库导出文件。
开源代码：GitHub仓库提供完整Django项目代码与数据处理脚本。
演示视频：展示系统核心功能（如查询“李白与杜甫的诗词关联”）。

五、风险评估与应对

风险	应对措施
大模型标注准确率不足	结合规则引擎（如正则表达式）补充抽取，或引入人工校验流程。
图谱查询性能瓶颈	对Neo4j建立索引，优化Cypher查询语句，限制单次返回节点数量。
前端动态图渲染卡顿	采用Web Worker分载计算，或简化图谱节点数量（如默认展示Top100关联诗词）。
数据版权问题	仅使用已进入公共领域的诗词（如作者逝世50年以上），标注数据来源。

六、团队分工

后端开发：负责Django API、Neo4j集成、大模型服务调用。
前端开发：实现可视化界面与交互逻辑。
数据工程师：爬取数据、训练标注模型、构建知识图谱。
测试与文档：编写测试用例、用户手册，管理项目进度。

七、验收标准

系统支持至少1万首诗词的知识图谱展示，查询响应时间<3秒。
知识抽取准确率（实体/关系）通过人工抽样检验达到85%以上。
用户满意度调查得分≥4分（5分制）。

项目负责人：
日期：

备注：本项目可扩展为文化教育类SaaS产品，后续可增加用户注释分享、诗词创作辅助等功能。

运行截图

项目案例

优势

1-项目均为博主学习开发自研，适合新手入门和学习使用
2-所有源码均一手开发，不是模版！不容易跟班里人重复！

为什么选择我

博主是CSDN毕设辅导博客第一人兼开派祖师爷、博主本身从事开发软件开发、有丰富的编程能力和水平、累积给上千名同学进行辅导、全网累积粉丝超过50W。是CSDN特邀作者、博客专家、新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流和合作。

🍅✌感兴趣的可以先收藏起来，点赞关注不迷路，想学习更多项目可以查看主页，大家在毕设选题，项目代码以及论文编写等相关问题都可以给我留言咨询，希望可以帮助同学们顺利毕业！🍅✌