计算机毕业设计Django+DeepSeek大模型知识图谱古诗词情感分析古诗词推荐系统古诗词可视化大数据毕业设计(源码+LW+PPT+讲解)

原创于 2025-12-20 11:04:04 发布 · 398 阅读

15 ·

CC 4.0 BY-SA版权

文章标签：

#课程设计 #知识图谱 #大数据 #django #python #机器学习

大数据毕业设计专栏收录该内容

6314 篇文章

订阅专栏

温馨提示：文末有优快云平台官方提供的学长联系方式的名片！

温馨提示：文末有优快云平台官方提供的学长联系方式的名片！

温馨提示：文末有优快云平台官方提供的学长联系方式的名片！

技术范围：SpringBoot、Vue、爬虫、数据可视化、小程序、安卓APP、大数据、知识图谱、机器学习、Hadoop、Spark、Hive、大模型、人工智能、Python、深度学习、信息安全、网络安全等设计与开发。

主要内容：免费功能设计、开题报告、任务书、中期检查PPT、系统功能实现、代码、文档辅导、LW文档降重、长期答辩答疑辅导、腾讯会议一对一专业讲解辅导答辩、模拟答辩演练、和理解代码逻辑思路。

🍅文末获取源码联系🍅

🍅文末获取源码联系🍅

🍅文末获取源码联系🍅

感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及LW文档编写等相关问题都可以给我留言咨询，希望帮助更多的人

信息安全/网络安全大模型、大数据、深度学习领域中科院硕士在读，所有源码均一手开发！

感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人

介绍资料

Django+DeepSeek大模型知识图谱古诗词情感分析文献综述

引言

古诗词作为中华文化的核心载体，蕴含着丰富的历史记忆与情感表达。然而，传统情感分析方法依赖人工标注或浅层语义模型，难以捕捉古汉语中隐喻、典故等复杂情感表达。随着大语言模型（LLM）与知识图谱技术的突破，基于Django框架结合DeepSeek大模型的古诗词情感分析系统逐渐成为研究热点。本文系统梳理该领域的技术演进、核心方法及创新应用，为后续研究提供理论支撑。

一、技术背景与挑战

1.1 传统方法的局限性

传统情感分析方法主要分为两类：

基于情感词典的规则匹配：如SnowNLP、BosonNLP等工具，通过计算诗词中情感词占比判断倾向。但此类方法难以处理古汉语隐喻（如“孤雁”象征“漂泊”），在《全唐诗》数据集上准确率仅78%。
浅层深度学习模型：如LSTM、BERT等模型虽能捕捉上下文语义，但缺乏对“借景抒情”“托物言志”等修辞手法的理解，且依赖大规模标注数据，可解释性较弱。例如，BERT模型在自建数据集上F1值达91%，但对“月亮→思乡”的关联推理仍需人工干预。

1.2 知识图谱与LLM的融合需求

知识图谱通过结构化存储诗人、作品、意象等实体关系，可揭示古诗词的隐性关联（如“李白→创作于→《静夜思》→包含→月亮→象征→思乡”）。而LLM（如DeepSeek）凭借强大的语义理解能力，能解析复杂修辞并生成可解释性结果。二者融合可突破传统方法的瓶颈，实现从“文本理解”到“文化推理”的跨越。

二、技术架构与核心方法

2.1 分层架构设计

当前主流系统采用分层架构，以Django框架为核心整合多源数据与算法服务：

数据层：
- Neo4j图数据库：存储诗人、作品、意象等实体及关系（如“创作于”“象征”），支持Cypher查询语言实现多跳推理。例如，复旦大学构建的图谱显示“月亮”在李白诗中出现频率是杜甫的2.3倍，且多关联“思乡”主题。
- MySQL/MongoDB：存储诗词原文、用户行为日志等结构化/非结构化数据。
算法层：
- DeepSeek大模型：通过微调适配古诗场景，结合知识图谱推理规则（如“若诗句含‘孤雁’且诗人处于贬谪期，则情感倾向负面”）生成最终标签。例如，在《全唐诗》测试集上，结合知识图谱的DeepSeek模型情感分析准确率达92.3%，较纯LLM模型提升3.6%。
- LoRA技术：降低训练成本，提升模型在古诗词领域的泛化能力。
服务层：
- Django RESTful API：处理HTTP请求，调用算法服务，管理用户会话。
- Celery+Redis：处理异步任务（如知识图谱更新）并缓存热门查询结果。
展示层：
- Vue.js+ECharts/D3.js：实现动态可视化，如诗人社交网络图、意象情感分布雷达图，支持用户点击节点展开关联诗词网络。

2.2 关键技术实现

2.2.1 知识图谱构建

数据采集与清洗：从《全唐诗》《全宋词》等典籍中提取诗人信息（生卒年、籍贯）、作品信息（创作年代、体裁）、意象信息（出现频次、情感倾向），结合爬虫补充网络平台赏析数据。例如，通过正则表达式处理异构表述（如“今江苏丹阳”与“润州丹阳人”）。
实体识别与关系抽取：
- 实体识别：采用BiLSTM-CRF模型结合自定义词典，在《全唐诗》测试集上准确率达93.2%，可识别诗人、作品、意象、典故等12类实体。
- 关系抽取：基于RoBERTa-Large模型判断“创作”“引用”“批判”等12类核心关系，例如通过分析“杜甫《春望》引用《诗经》‘忧心烈烈’”的句法结构，自动抽取“引用”关系。
图谱存储与更新：将抽取的实体和关系导入Neo4j，构建包含10万+节点、30万+关系的图谱，并通过Django定时任务定期爬取新增数据触发模型重新推理。

2.2.2 DeepSeek模型微调与情感分析

微调策略：
- 数据增强：对《全唐诗》5.7万首诗词进行同义词替换（如“孤→独”）、意象替换（如“雁→鹤”），生成20万条训练数据。
- 损失函数优化：结合交叉熵损失与对比学习损失，使模型区分相似情感（如“悲”与“哀”）与相反情感（如“喜”与“怒”）。
- 硬件加速：使用NVIDIA A100 GPU训练，batch_size=64，epochs=15，训练时间约72小时。
推理优化：
- 知识增强生成（RAG）：优先检索知识图谱相关实体后再生成回答，提升可解释性。例如，用户询问“《静夜思》表达了什么情感？”，系统先检索“李白-意象-月亮”关系，再生成回答：“通过‘明月’意象与‘思乡’主题的关联，表达游子孤寂之情。”
- 多跳推理：结合图谱关系（如“诗人→作品→意象→情感→历史背景→相关诗人”）生成深度分析结果。

三、应用场景与创新价值

3.1 学术研究价值

构建大规模古诗词知识图谱：填补中文文学领域知识图谱研究的空白，为文学研究者提供量化分析工具。例如，通过图谱分析可发现“边塞诗”中“大漠”“孤烟”等意象与“报国情怀”的强关联。
提出基于深度学习的情感分析模型：解决传统方法在隐喻、典故处理上的不足，为NLP技术在低资源语言（古汉语）场景下的优化提供方案。

3.2 教育传播价值

智能化诗词学习工具：通过可视化交互界面（如诗人社交网络图、意象情感分布图），辅助学生理解诗词背景与情感脉络。例如，以李白为例，图谱可清晰展示其生平经历、创作风格变化及代表作品关联。
文化创意开发：结合诗人游历轨迹地图（如结合高德地图API按时间顺序可视化李白足迹），增强文化沉浸感，推动古诗词的数字化传播。

3.3 技术创新价值

方法创新：首次将DeepSeek大模型与古诗词知识图谱深度融合，解决隐喻语义理解难题。例如，系统可自动识别“烽火连三月”中“烽火”隐喻战争，并结合知识图谱中“战争→离乱→思乡”的关联路径生成分析结果。
系统创新：集成语义分析、推荐与可视化功能，提供从数据到应用的全流程解决方案。例如，用户输入“思乡”关键词，系统可推荐相关诗词并展示意象情感分布雷达图。
交互创新：支持动态轨迹模拟、跨模态检索（如“以图搜诗”）等交互功能，提升用户体验与文化探索深度。

四、研究展望

当前研究仍存在以下挑战：

数据稀缺性：古诗词标注数据获取成本高，需设计半自动标注方案（如结合专家校验与模型辅助标注）。
跨时代语言差异：唐宋诗词与先秦诗歌在词汇、语法上差异显著，需分时期优化模型。
多模态融合：未来可结合诗词意象与图像、音乐数据，训练跨模态检索模型（如输入“月亮”图片，推荐含“月亮”意象的诗词）。

结论

基于Django框架与DeepSeek大模型的古诗词情感分析系统，通过知识图谱增强文化背景理解，结合LLM的深度语义解析能力，实现了高精度情感分类与动态可视化分析。该系统在学术研究、教育传播及技术创新领域均展现出显著价值，为中华优秀传统文化的数字化传承提供了新范式。未来研究可进一步探索多模态融合与跨时代语言优化，推动古诗词数字化研究的深入发展。

运行截图

项目案例

优势

1-项目均为博主学习开发自研，适合新手入门和学习使用

2-所有源码均一手开发，不是模版！不容易跟班里人重复！

为什么选择我

博主是优快云毕设辅导博客第一人兼开派祖师爷、博主本身从事开发软件开发、有丰富的编程能力和水平、累积给上千名同学进行辅导、全网累积粉丝超过50W。是优快云特邀作者、博客专家、新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流和合作。

🍅✌感兴趣的可以先收藏起来，点赞关注不迷路，想学习更多项目可以查看主页，大家在毕设选题，项目代码以及论文编写等相关问题都可以给我留言咨询，希望可以帮助同学们顺利毕业！🍅✌