温馨提示:文末有 优快云 平台官方提供的学长联系方式的名片!
温馨提示:文末有 优快云 平台官方提供的学长联系方式的名片!
温馨提示:文末有 优快云 平台官方提供的学长联系方式的名片!
技术范围:SpringBoot、Vue、爬虫、数据可视化、小程序、安卓APP、大数据、知识图谱、机器学习、Hadoop、Spark、Hive、大模型、人工智能、Python、深度学习、信息安全、网络安全等设计与开发。
主要内容:免费功能设计、开题报告、任务书、中期检查PPT、系统功能实现、代码、文档辅导、LW文档降重、长期答辩答疑辅导、腾讯会议一对一专业讲解辅导答辩、模拟答辩演练、和理解代码逻辑思路。
🍅文末获取源码联系🍅
🍅文末获取源码联系🍅
🍅文末获取源码联系🍅
感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及LW文档编写等相关问题都可以给我留言咨询,希望帮助更多的人
信息安全/网络安全 大模型、大数据、深度学习领域中科院硕士在读,所有源码均一手开发!
感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助更多的人

介绍资料
Django+DeepSeek大模型知识图谱古诗词情感分析文献综述
引言
古诗词作为中华文化的核心载体,蕴含着丰富的历史记忆与情感表达。然而,传统情感分析方法依赖人工标注或浅层语义模型,难以捕捉古汉语中隐喻、典故等复杂情感表达。随着大语言模型(LLM)与知识图谱技术的突破,基于Django框架结合DeepSeek大模型的古诗词情感分析系统逐渐成为研究热点。本文系统梳理该领域的技术演进、核心方法及创新应用,为后续研究提供理论支撑。
一、技术背景与挑战
1.1 传统方法的局限性
传统情感分析方法主要分为两类:
- 基于情感词典的规则匹配:如SnowNLP、BosonNLP等工具,通过计算诗词中情感词占比判断倾向。但此类方法难以处理古汉语隐喻(如“孤雁”象征“漂泊”),在《全唐诗》数据集上准确率仅78%。
- 浅层深度学习模型:如LSTM、BERT等模型虽能捕捉上下文语义,但缺乏对“借景抒情”“托物言志”等修辞手法的理解,且依赖大规模标注数据,可解释性较弱。例如,BERT模型在自建数据集上F1值达91%,但对“月亮→思乡”的关联推理仍需人工干预。
1.2 知识图谱与LLM的融合需求
知识图谱通过结构化存储诗人、作品、意象等实体关系,可揭示古诗词的隐性关联(如“李白→创作于→《静夜思》→包含→月亮→象征→思乡”)。而LLM(如DeepSeek)凭借强大的语义理解能力,能解析复杂修辞并生成可解释性结果。二者融合可突破传统方法的瓶颈,实现从“文本理解”到“文化推理”的跨越。
二、技术架构与核心方法
2.1 分层架构设计
当前主流系统采用分层架构,以Django框架为核心整合多源数据与算法服务:
- 数据层:
- Neo4j图数据库:存储诗人、作品、意象等实体及关系(如“创作于”“象征”),支持Cypher查询语言实现多跳推理。例如,复旦大学构建的图谱显示“月亮”在李白诗中出现频率是杜甫的2.3倍,且多关联“思乡”主题。
- MySQL/MongoDB:存储诗词原文、用户行为日志等结构化/非结构化数据。
- 算法层:
- DeepSeek大模型:通过微调适配古诗场景,结合知识图谱推理规则(如“若诗句含‘孤雁’且诗人处于贬谪期,则情感倾向负面”)生成最终标签。例如,在《全唐诗》测试集上,结合知识图谱的DeepSeek模型情感分析准确率达92.3%,较纯LLM模型提升3.6%。
- LoRA技术:降低训练成本,提升模型在古诗词领域的泛化能力。
- 服务层:
- Django RESTful API:处理HTTP请求,调用算法服务,管理用户会话。
- Celery+Redis:处理异步任务(如知识图谱更新)并缓存热门查询结果。
- 展示层:
- Vue.js+ECharts/D3.js:实现动态可视化,如诗人社交网络图、意象情感分布雷达图,支持用户点击节点展开关联诗词网络。
2.2 关键技术实现
2.2.1 知识图谱构建
- 数据采集与清洗:从《全唐诗》《全宋词》等典籍中提取诗人信息(生卒年、籍贯)、作品信息(创作年代、体裁)、意象信息(出现频次、情感倾向),结合爬虫补充网络平台赏析数据。例如,通过正则表达式处理异构表述(如“今江苏丹阳”与“润州丹阳人”)。
- 实体识别与关系抽取:
- 实体识别:采用BiLSTM-CRF模型结合自定义词典,在《全唐诗》测试集上准确率达93.2%,可识别诗人、作品、意象、典故等12类实体。
- 关系抽取:基于RoBERTa-Large模型判断“创作”“引用”“批判”等12类核心关系,例如通过分析“杜甫《春望》引用《诗经》‘忧心烈烈’”的句法结构,自动抽取“引用”关系。
- 图谱存储与更新:将抽取的实体和关系导入Neo4j,构建包含10万+节点、30万+关系的图谱,并通过Django定时任务定期爬取新增数据触发模型重新推理。
2.2.2 DeepSeek模型微调与情感分析
- 微调策略:
- 数据增强:对《全唐诗》5.7万首诗词进行同义词替换(如“孤→独”)、意象替换(如“雁→鹤”),生成20万条训练数据。
- 损失函数优化:结合交叉熵损失与对比学习损失,使模型区分相似情感(如“悲”与“哀”)与相反情感(如“喜”与“怒”)。
- 硬件加速:使用NVIDIA A100 GPU训练,batch_size=64,epochs=15,训练时间约72小时。
- 推理优化:
- 知识增强生成(RAG):优先检索知识图谱相关实体后再生成回答,提升可解释性。例如,用户询问“《静夜思》表达了什么情感?”,系统先检索“李白-意象-月亮”关系,再生成回答:“通过‘明月’意象与‘思乡’主题的关联,表达游子孤寂之情。”
- 多跳推理:结合图谱关系(如“诗人→作品→意象→情感→历史背景→相关诗人”)生成深度分析结果。
三、应用场景与创新价值
3.1 学术研究价值
- 构建大规模古诗词知识图谱:填补中文文学领域知识图谱研究的空白,为文学研究者提供量化分析工具。例如,通过图谱分析可发现“边塞诗”中“大漠”“孤烟”等意象与“报国情怀”的强关联。
- 提出基于深度学习的情感分析模型:解决传统方法在隐喻、典故处理上的不足,为NLP技术在低资源语言(古汉语)场景下的优化提供方案。
3.2 教育传播价值
- 智能化诗词学习工具:通过可视化交互界面(如诗人社交网络图、意象情感分布图),辅助学生理解诗词背景与情感脉络。例如,以李白为例,图谱可清晰展示其生平经历、创作风格变化及代表作品关联。
- 文化创意开发:结合诗人游历轨迹地图(如结合高德地图API按时间顺序可视化李白足迹),增强文化沉浸感,推动古诗词的数字化传播。
3.3 技术创新价值
- 方法创新:首次将DeepSeek大模型与古诗词知识图谱深度融合,解决隐喻语义理解难题。例如,系统可自动识别“烽火连三月”中“烽火”隐喻战争,并结合知识图谱中“战争→离乱→思乡”的关联路径生成分析结果。
- 系统创新:集成语义分析、推荐与可视化功能,提供从数据到应用的全流程解决方案。例如,用户输入“思乡”关键词,系统可推荐相关诗词并展示意象情感分布雷达图。
- 交互创新:支持动态轨迹模拟、跨模态检索(如“以图搜诗”)等交互功能,提升用户体验与文化探索深度。
四、研究展望
当前研究仍存在以下挑战:
- 数据稀缺性:古诗词标注数据获取成本高,需设计半自动标注方案(如结合专家校验与模型辅助标注)。
- 跨时代语言差异:唐宋诗词与先秦诗歌在词汇、语法上差异显著,需分时期优化模型。
- 多模态融合:未来可结合诗词意象与图像、音乐数据,训练跨模态检索模型(如输入“月亮”图片,推荐含“月亮”意象的诗词)。
结论
基于Django框架与DeepSeek大模型的古诗词情感分析系统,通过知识图谱增强文化背景理解,结合LLM的深度语义解析能力,实现了高精度情感分类与动态可视化分析。该系统在学术研究、教育传播及技术创新领域均展现出显著价值,为中华优秀传统文化的数字化传承提供了新范式。未来研究可进一步探索多模态融合与跨时代语言优化,推动古诗词数字化研究的深入发展。
运行截图
推荐项目
上万套Java、Python、大数据、机器学习、深度学习等高级选题(源码+lw+部署文档+讲解等)
项目案例











优势
1-项目均为博主学习开发自研,适合新手入门和学习使用
2-所有源码均一手开发,不是模版!不容易跟班里人重复!

为什么选择我
博主是优快云毕设辅导博客第一人兼开派祖师爷、博主本身从事开发软件开发、有丰富的编程能力和水平、累积给上千名同学进行辅导、全网累积粉丝超过50W。是优快云特邀作者、博客专家、新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流和合作。
🍅✌感兴趣的可以先收藏起来,点赞关注不迷路,想学习更多项目可以查看主页,大家在毕设选题,项目代码以及论文编写等相关问题都可以给我留言咨询,希望可以帮助同学们顺利毕业!🍅✌
源码获取方式
🍅由于篇幅限制,获取完整文章或源码、代做项目的,拉到文章底部即可看到个人联系方式。🍅
点赞、收藏、关注,不迷路,下方查↓↓↓↓↓↓获取联系方式↓↓↓↓↓↓↓↓



















812

被折叠的 条评论
为什么被折叠?



