计算机毕业设计Django+大模型中华古诗词知识图谱可视化 古诗词智能问答系统 古诗词数据分析 古诗词情感分析模型 自然语言处理NLP 机器学习 深度学习
温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片!
温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片!
温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片!
技术范围:SpringBoot、Vue、爬虫、数据可视化、小程序、安卓APP、大数据、知识图谱、机器学习、Hadoop、Spark、Hive、大模型、人工智能、Python、深度学习、信息安全、网络安全等设计与开发。
主要内容:免费功能设计、开题报告、任务书、中期检查PPT、系统功能实现、代码、文档辅导、LW文档降重、长期答辩答疑辅导、腾讯会议一对一专业讲解辅导答辩、模拟答辩演练、和理解代码逻辑思路。
🍅文末获取源码联系🍅
🍅文末获取源码联系🍅
🍅文末获取源码联系🍅
感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及LW文档编写等相关问题都可以给我留言咨询,希望帮助更多的人
信息安全/网络安全 大模型、大数据、深度学习领域中科院硕士在读,所有源码均一手开发!
感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助更多的人
介绍资料
任务书:Django + 大模型中华古诗词知识图谱可视化系统
一、项目背景与目标
中华古诗词是中华文化的重要载体,蕴含丰富的历史、哲学与美学价值。然而,传统诗词数据库多以文本检索为主,缺乏对诗词间关联关系的深度挖掘与可视化展示。本项目旨在结合Django框架与大语言模型(LLM)技术,构建一个交互式古诗词知识图谱可视化系统,实现以下目标:
- 知识抽取与关联:利用大模型(如LLaMA、Qwen)自动提取诗词中的实体(如作者、朝代、意象、典故)及关系,构建结构化知识图谱。
- 可视化探索:通过图数据库(Neo4j)与前端技术(D3.js/ECharts)展示诗词间的隐含关联(如“李白→《静夜思》→月亮意象→中秋典故”)。
- 智能检索与推荐:支持自然语言查询(如“描写边塞的唐诗”),并基于图谱推荐相关诗词或文化背景知识。
- 文化教育应用:为学者、学生提供诗词研究工具,辅助理解诗词意境与历史脉络。
二、项目范围与功能
1. 系统核心功能
- 知识图谱构建模块:
- 数据采集:爬取公开诗词数据集(如“全唐诗”“全宋词”)、权威注释文献。
- 实体识别与关系抽取:
- 使用大模型(如ChatGLM、InternLM)标注诗词中的实体(人物、地点、意象)及关系(创作时间、主题关联、典故引用)。
- 人工校验关键实体(如争议性历史人物),确保知识准确性。
- 图谱存储:将结构化数据导入Neo4j图数据库,支持高效关系查询。
- 可视化交互模块:
- 动态图展示:基于D3.js或ECharts实现诗词节点的力导向图布局,支持缩放、拖拽、高亮关联路径。
- 多维度筛选:按朝代、作者、主题(如“送别”“思乡”)过滤图谱节点。
- 路径探索:展示诗词间的关联路径(如“王维→山水诗→孟浩然→田园诗”)。
- 智能检索与推荐模块:
- 自然语言查询:用户输入口语化问题(如“苏轼写过哪些关于西湖的诗?”),系统解析意图并返回图谱结果。
- 相似诗词推荐:基于嵌入模型(如Sentence-BERT)计算诗词语义相似度,推荐风格或主题相近的作品。
- 后台管理模块(Django Admin):
- 管理员可上传新诗词数据、修正图谱关系、监控系统日志。
2. 技术栈
- 后端框架:Django 4.0+(RESTful API开发)
- 大模型服务:Hugging Face Transformers(本地部署轻量化模型)、LangChain(查询解析)
- 图数据库:Neo4j 5.0+(存储知识图谱)
- 前端可视化:D3.js(动态图) + ECharts(统计图表) + Vue.js(交互界面)
- 数据爬取:Scrapy(诗词文本) + BeautifulSoup(注释解析)
- 部署环境:Docker(容器化) + Nginx(Web服务器)
三、项目实施计划
阶段1:需求分析与数据准备(2周)
- 调研用户需求(学者、学生、文化爱好者),明确核心功能优先级。
- 爬取诗词文本及注释数据(如“古诗文网”“中国哲学书电子化计划”),存储至MySQL数据库。
- 搭建Django基础框架,配置Neo4j图数据库连接。
阶段2:知识图谱构建(4周)
- 实体识别:
- 使用Prompt Engineering优化大模型,提取诗词中的实体(如“《将进酒》→作者:李白→朝代:唐”)。
- 标注1000首诗词作为训练集,微调轻量级模型(如Alpaca)提升准确率。
- 关系抽取:
- 定义关系类型(如“创作”“引用”“主题关联”),通过大模型生成三元组(如“《静夜思》-主题-思乡”)。
- 图谱导入:将三元组批量导入Neo4j,构建初始图谱。
阶段3:可视化与智能功能开发(5周)
- 前端开发:
- 使用Vue.js搭建单页应用(SPA),集成D3.js实现动态图渲染。
- 开发查询输入框、筛选面板、节点详情弹窗等组件。
- 智能检索:
- 基于LangChain解析用户查询意图,转换为Cypher查询语句(如“找出所有描写战争的宋词”)。
- 实现相似诗词推荐API,调用嵌入模型计算余弦相似度。
- 测试与优化:
- 单元测试:验证知识抽取准确率(目标>90%)、查询响应时间(<2秒)。
- 用户测试:邀请目标用户体验原型系统,收集反馈调整交互设计。
阶段4:部署与文档编写(2周)
- 使用Docker打包Django后端、Neo4j数据库与前端静态文件。
- 编写《系统使用手册》《API文档》《数据来源说明》。
- 部署至云服务器(如阿里云ECS),配置域名与HTTPS证书。
四、预期成果
- 在线系统:可公开访问的古诗词知识图谱平台(如
http://poetry-graph.example.com)。 - 知识图谱数据:包含5万+诗词节点、10万+关系边的Neo4j数据库导出文件。
- 开源代码:GitHub仓库提供完整Django项目代码与数据处理脚本。
- 演示视频:展示系统核心功能(如查询“李白与杜甫的诗词关联”)。
五、风险评估与应对
| 风险 | 应对措施 |
|---|---|
| 大模型标注准确率不足 | 结合规则引擎(如正则表达式)补充抽取,或引入人工校验流程。 |
| 图谱查询性能瓶颈 | 对Neo4j建立索引,优化Cypher查询语句,限制单次返回节点数量。 |
| 前端动态图渲染卡顿 | 采用Web Worker分载计算,或简化图谱节点数量(如默认展示Top100关联诗词)。 |
| 数据版权问题 | 仅使用已进入公共领域的诗词(如作者逝世50年以上),标注数据来源。 |
六、团队分工
- 后端开发:负责Django API、Neo4j集成、大模型服务调用。
- 前端开发:实现可视化界面与交互逻辑。
- 数据工程师:爬取数据、训练标注模型、构建知识图谱。
- 测试与文档:编写测试用例、用户手册,管理项目进度。
七、验收标准
- 系统支持至少1万首诗词的知识图谱展示,查询响应时间<3秒。
- 知识抽取准确率(实体/关系)通过人工抽样检验达到85%以上。
- 用户满意度调查得分≥4分(5分制)。
项目负责人:
日期:
备注:本项目可扩展为文化教育类SaaS产品,后续可增加用户注释分享、诗词创作辅助等功能。
运行截图
推荐项目
上万套Java、Python、大数据、机器学习、深度学习等高级选题(源码+lw+部署文档+讲解等)
项目案例
优势
1-项目均为博主学习开发自研,适合新手入门和学习使用
2-所有源码均一手开发,不是模版!不容易跟班里人重复!
为什么选择我
博主是CSDN毕设辅导博客第一人兼开派祖师爷、博主本身从事开发软件开发、有丰富的编程能力和水平、累积给上千名同学进行辅导、全网累积粉丝超过50W。是CSDN特邀作者、博客专家、新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流和合作。
🍅✌感兴趣的可以先收藏起来,点赞关注不迷路,想学习更多项目可以查看主页,大家在毕设选题,项目代码以及论文编写等相关问题都可以给我留言咨询,希望可以帮助同学们顺利毕业!🍅✌
源码获取方式
🍅由于篇幅限制,获取完整文章或源码、代做项目的,拉到文章底部即可看到个人联系方式。🍅
点赞、收藏、关注,不迷路,下方查↓↓↓↓↓↓获取联系方式↓↓↓↓↓↓↓↓
