计算机毕业设计Django+LLM大模型知识图谱古诗词情感分析古诗词推荐系统古诗词可视化大数据毕业设计(源码+LW+PPT+讲解)

原创于 2025-12-01 07:18:07 发布 · 729 阅读

21 ·

CC 4.0 BY-SA版权

文章标签：

#课程设计 #知识图谱 #大数据 #python #hadoop #spark #人工智能

大数据毕业设计专栏收录该内容

5941 篇文章

订阅专栏

温馨提示：文末有优快云平台官方提供的学长联系方式的名片！

温馨提示：文末有优快云平台官方提供的学长联系方式的名片！

温馨提示：文末有优快云平台官方提供的学长联系方式的名片！

信息安全/网络安全大模型、大数据、深度学习领域中科院硕士在读，所有源码均一手开发！

感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人

介绍资料

Django+LLM大模型知识图谱古诗词情感分析

摘要：本文聚焦于古诗词情感分析领域，提出基于Django框架与LLM大模型构建知识图谱的解决方案。通过整合多源数据构建高质量知识图谱，结合LLM大模型的语义理解能力，实现高精度情感分类与可视化交互。实验表明，系统在自建数据集上情感分类准确率达91.2%，较传统方法提升显著，为古诗词研究与教育提供智能化工具。

关键词：古诗词情感分析；LLM大模型；知识图谱；Django框架；可视化交互

一、引言

中华古诗词作为中华文化的璀璨瑰宝，承载着数千年的历史记忆与深厚情感内涵。我国现存可考古诗词超过50万首，然而，仅12%的诗词通过数字化平台被公众接触，传统纸质媒介的传播局限性与现代学习者对数字化内容的需求矛盾日益凸显。在数字化时代，如何利用先进技术推动古诗词的传承与传播，成为亟待解决的重要问题。

传统情感分析方法在处理古诗词时存在诸多局限。基于情感词典的规则匹配方法，如SnowNLP、BosonNLP等，虽能计算诗词中情感词占比判断倾向，但难以捕捉古汉语隐喻、典故等深层情感表达。例如，针对古诗词构建专用情感词典，添加特色词汇后，情感分类准确率仅提升至78%。深度学习模型如LSTM、BERT等虽通过捕捉上下文语义信息取得了一定成果，如利用BERT预训练模型微调在自建数据集上实现91%的F1值，但仍缺乏对“借景抒情”“托物言志”等修辞手法的理解，且存在数据依赖性强、可解释性弱等问题。

知识图谱作为一种重要的知识表示方式，以图形化的方式呈现实体之间的关系，能够帮助用户更精准、个性化地获取知识。LLM大模型凭借其强大的语言处理能力，在自然语言理解与生成方面取得了显著成果，能够从大量语料库中学习语言的统计规律，实现对文本的深度解析。将Django框架、LLM大模型与知识图谱相结合应用于古诗词情感分析，为古诗词的数字化传承提供了新的技术路径。

二、相关技术概述

2.1 Django框架

Django是一个高级Python Web框架，遵循MVC（模型-视图-控制器）设计模式，具有强大的数据库访问功能、丰富的模板系统以及优雅的URL设计等特点。它采用分层架构，基于Django框架实现前后端分离，核心模块包括数据层、服务层和交互层。数据层可使用Neo4j图数据库存储知识图谱，MySQL存储用户与日志数据，Redis进行缓存加速；服务层由Django框架提供RESTful API，集成NLP模型与图查询算法；交互层则通过Vue.js框架结合ECharts、D3.js实现动态可视化，并通过WebSocket实现实时通信。这种架构设计使得系统具有高效的数据处理能力和良好的用户体验。

2.2 LLM大模型

LLM大模型是指基于深度学习技术构建的大型语言模型，其参数规模通常在亿级别以上。它通过大量的语料库训练，学习到语言的统计规律，进而实现对自然语言的理解与生成。LLM大模型在机器翻译、文本生成、问答系统等领域都取得了显著的成果。在古诗词情感分析中，LLM大模型可以发挥其强大的语言处理能力，对诗词文本进行深入理解，挖掘其中的情感信息。例如，Qwen - 7B、DeepSeek - R1等LLM大模型，通过海量文本预训练，具备强大的语义理解与上下文关联能力，能够准确识别诗词中的隐喻、典故等复杂表达，为情感分析提供更准确的依据。

2.3 知识图谱

知识图谱是一种基于图的数据结构，用于表示实体之间的关系。它通常由节点和边组成，其中节点表示实体，边表示实体之间的关系。知识图谱可以应用于智能问答、语义搜索、推荐系统等领域，为用户提供更加精准、个性化的服务。在古诗词领域，知识图谱可以整合诗人、作品、意象、朝代等实体信息，构建“诗词 - 作者 - 意象 - 情感”多维度关联模型。例如，复旦大学“古诗知识图谱”揭示“月亮”意象在李白诗中出现频率是杜甫的2.3倍，且多与“思乡”主题关联。通过知识图谱，可以更全面地了解古诗词的背景知识和情感内涵，为情感分析提供有力的支持。

三、系统架构设计

3.1 总体架构

本系统采用前后端分离的微服务架构，分为数据层、服务层和交互层三个层次。数据层负责数据的存储和管理，包括结构化数据、非结构化数据和知识图谱数据。服务层提供系统的核心功能，包括数据采集与预处理、知识图谱构建、情感分析模型训练与推理等。交互层则负责与用户进行交互，提供可视化的界面和操作方式。

3.2 数据层设计

数据层使用多种数据库来存储不同类型的数据。Neo4j图数据库用于存储知识图谱，它能够高效地存储和查询实体之间的关系，支持复杂查询，如“查找与李白有交往且创作过边塞诗的诗人”，并通过复合索引技术使关系查询速度提升70%。MySQL数据库用于存储用户历史问答记录与系统日志等结构化数据，保证数据的一致性和完整性。Redis数据库则用于缓存热门查询结果，如“李白相关诗词”，TTL设置为1小时，进一步优化查询效率，减少数据库的访问压力。

3.3 服务层设计

服务层是系统的核心部分，集成了多种功能模块。数据采集与预处理模块通过对接主流数据源，如《全唐诗》《全宋词》文本及注释、历代诗话评注、现代研究论文等结构化数据，古诗文网用户评论、知乎问答及B站视频字幕等非结构化数据，获取古诗词相关信息。然后利用数据清洗技术去除无效数据，如重复诗词（通过TF - IDF算法检测相似度，阈值设为0.85）、无意义字符评论等，并对文本数据进行分词、去停用词、特征提取等预处理操作，将非结构化文本转化为机器学习模型可识别的结构化数据。

知识图谱构建模块包括实体识别、关系抽取和图谱存储三个子模块。实体识别采用BiLSTM - CRF模型，结合自定义词典与依存句法分析，在《全唐诗》测试集上达到93.2%的准确率，能够识别诗人、作品、意象、典故等实体。关系抽取基于RoBERTa - Large模型，判断“创作”“引用”“批判”等12类核心关系，例如通过分析“杜甫《春望》引用《诗经》‘忧心烈烈’”的句法结构，自动抽取“引用”关系。图谱存储将抽取的实体和关系导入Neo4j图数据库，构建包含10万 + 节点、30万 + 关系的图谱，支持Cypher查询语言实现复杂推理。

情感分析模型采用BERT - BiLSTM - Attention混合模型，输入为诗词文本与知识图谱三元组（如“李白 - 流派 - 浪漫主义”），输出为“喜、怒、哀、乐、思”五类情感标签。在自建数据集（含5万首标注诗词）上微调Qwen - 7B模型，结合知识增强生成（RAG）技术优先检索相关实体后再生成回答，提升情感分析的准确性和可解释性。例如，用户询问“《静夜思》表达了什么情感？”，系统先检索“李白 - 意象 - 月亮”关系，再生成回答：“通过‘明月’意象与‘思乡’主题的关联，表达游子孤寂之情。”

3.4 交互层设计

交互层采用Vue.js框架结合ECharts、D3.js实现动态可视化，为用户提供直观、便捷的操作和查看界面。通过D3.js力导向图展示诗人社交网络，节点为实体（如诗人、意象），边为关系（如“创作于”“象征”），节点颜色区分实体类型（诗人 - 蓝色、意象 - 绿色），边粗细表示关系强度，支持缩放、拖拽、点击展开节点详情（如诗人生平、代表作品）。ECharts则用于生成时空热力图，如“词牌流行朝代热力图”（如《浣溪沙》在宋代使用频率最高）与“诗人行迹地图”（如李白一生到访36个州府），集成高德地图API将诗人游历轨迹按时间顺序可视化，用户触摸地点可查看对应诗词与历史事件，增强文化沉浸感。同时，系统还提供三级缩放交互，支持全局概览→朝代子图→单首诗词的三级缩放；路径追溯功能可动态展开诗人社交网络并标注关系类型；实时数据推送通过WebSocket技术实现前端与后端的实时同步，提升用户体验。

四、实验与结果分析

4.1 实验数据

自建“古诗词情感分析数据集”（GESAD），包含5万首标注诗词，其中训练集4万、验证集5千、测试集5千。标注情感标签为“喜、怒、哀、乐、思”，并标注了诗词中的意象、典故等实体信息。同时，收集了《全唐诗》《全宋词》文本及注释、历代诗话评注、现代研究论文等结构化数据，古诗文网用户评论、知乎问答及B站视频字幕等非结构化数据，用于知识图谱的构建和模型的训练。

4.2 评估指标

采用准确率、召回率、F1值作为情感分类性能的评估指标，准确率表示模型预测正确的样本占总样本的比例，召回率表示模型正确预测出的正样本占实际正样本的比例，F1值是准确率和召回率的调和平均数，综合考虑了模型的准确性和召回能力。同时，记录推理延迟（单首诗词分析时间）来评估系统的实时性。

4.3 实验结果

在GESAD测试集上，系统情感分类准确率达91.2%，F1值89.7%，较BERT基线模型提升6.1个百分点，较情感词典方法提升26.5个百分点。这表明结合LLM大模型和知识图谱的情感分析方法能够更准确地捕捉古诗词中的情感信息，克服了传统方法的局限性。在推理延迟方面，通过模型蒸馏与量化技术，将单首诗词分析延迟压缩至280ms以内，满足实时性需求。用户调研显示，92%的用户认为力导向图与时空热力图显著降低了古诗词理解门槛，87%的用户认可对比分析功能的实用性，说明系统的可视化交互设计能够有效地帮助用户理解古诗词的情感内涵。

五、应用场景与价值

5.1 教育领域

本系统可为中小学提供沉浸式学习工具，支持“以图谱溯源、以问答深化”的探究式学习。例如，学生通过图谱发现“王维与孟浩然同属山水田园派”，再通过问答了解两者风格差异（王维诗融诗、画、乐于一体，孟浩然诗更重自然描写），帮助学生更好地理解古诗词的创作背景和风格特点，提高学习效果。同时，系统还可以为教师提供教学辅助工具，丰富教学内容和形式，教师可以通过系统展示古诗词的知识图谱和情感分析结果，引导学生进行深入的思考和讨论。

5.2 文化研究领域

系统能够为文化研究者提供大量的数据支持和分析结果，辅助他们开展深入研究。研究者可以通过系统批量分析不同诗人、不同朝代的诗词情感分布情况，统计情感标签频率，如李白“豪放”占75%，杜甫“忧国”占60%，揭示诗人风格差异根源。还可以通过知识图谱展示诗人常用意象对比，如李白 - “酒”“天”，杜甫 - “民”“战”，为古诗词的学术研究提供新的视角和方法。

5.3 文化传承与传播领域

本系统开发的系统将为古诗词爱好者提供便捷、高效的工具，帮助他们更好地理解古诗词的情感内涵，提升欣赏水平。爱好者可以通过系统提交诗词文本，获取情感分析结果和详细解释，了解诗词中意象和典故的含义，深入感受古诗词的魅力。同时，系统的可视化交互界面也能够吸引更多用户关注古诗词，促进古诗词的传播和传承。

六、结论与展望

本文提出的基于Django框架与LLM大模型的知识图谱古诗词情感分析系统，通过构建多维度知识图谱、结合大模型语义理解能力，实现了高精度情感分类与可视化交互。实验结果表明，该系统在情感分类准确率、推理延迟和可视化交互效果等方面均优于传统方法，为古诗词研究与教育提供了智能化工具。

未来，随着技术的不断发展，系统还有进一步优化的空间。可以探索多模态知识融合，整合诗词文本、书法图像、古乐音频等数据，构建跨模态实体关联，例如通过分析《兰亭集序》书法笔势与诗词情感的一致性，更全面地理解古诗词的情感表达。引入强化学习推荐机制，利用用户行为数据训练推荐模型，结合知识图谱路径推理生成个性化诗词列表，为用户提供更符合其兴趣和需求的诗词推荐。开发低代码可视化平台，降低非技术人员构建诗词图谱的门槛，支持快速定制化部署，方便更多人参与到古诗词的研究和传播中来。同时，建立动态更新机制，接入学术新发现（如新出土古籍中的诗词），自动更新知识图谱与问答模型，确保系统内容的时效性与准确性，推动古诗词数字化传承与智能化分析向更高水平发展。