- 博客(3)
- 收藏
- 关注
原创 使用LDA模型提取政策主题
Latent Dirichlet Allocation (LDA) 是一种生成式概率模型,常用于主题模型。其主要目的是从大量文档中自动提取隐藏的主题。LDA假设每个文档由多个主题组成,每个主题由一组词汇以不同的概率分布组成。文档生成过程每个文档被视为若干主题的混合。每个主题由一组单词组成,且这些单词以不同的概率出现。通过不断迭代,LDA模型能够推断出这些隐藏的主题及其相关的词汇分布。模型训练。
2024-05-31 15:07:01
974
原创 爬取股吧评论(东方财经网)
本文使用MySQL数据库,平台用的DBeaver与python进行股吧数据爬取,由于网站的反爬虫机制,本文章添加了随机用户代理与随机延时,但在爬取五六十页后,爬虫页面会变换,基本为方正证卷吧,如果页面变换,过一个小时之后在爬。
2024-05-31 14:16:52
2476
原创 基于情感分析的LSTM预测股票走势
利用LSTM的强大时间序列分析能力,对股票市场的历史数值数据进行深入学习,以捕获股价变动中的长期依赖和周期性模式,LSTM模型的选择基于其在其他金融时间序列预测中表现出的优越性能,尤其是其能力在于处理长时间跨度的数据依赖关系。而后通过文本挖掘技术,特别是先进的自然语言处理工具,从互联网财经新闻平台、如东方财富网股吧论坛中提取影响市场情绪的关键信息。随后采用了情感分析来量化文本中的情绪倾向
2024-05-31 13:11:49
4512
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人