
数据挖掘
文章平均质量分 96
Petrichoryi
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python爬虫获取给定新浪微博评论
一个简单的微博评论爬取示例代码原创 2020-06-21 00:17:22 · 1703 阅读 · 0 评论 -
基于CNN的文本情感分析
情感分析是自然语言处理中很常见的任务,它的目的是识别出一段文本潜在的情感,是表扬还是批评,是支持还是反对。比如我们可以使用情感分析去分析社媒的评论,从而得到网友对某件事的看法,进一步分析可以得到舆论的趋势。转载 2020-05-03 20:13:16 · 4362 阅读 · 1 评论 -
基于情感词典的文本情感分析(附代码)
基于情感词典的情感分析应该是最简单传统的情感分析方法。原创 2020-04-30 21:44:00 · 57674 阅读 · 112 评论 -
Python对网页信息进行爬取并对标题分词
本篇文章主要对新浪新闻进行python爬虫爬取。1.主要使用的python库requestsbs4jsonjieba2.爬取网页的信息爬取的新浪网页:广西第四批援湖北抗疫医疗队结束隔离休整有序返岗点击右键检查,根据网页的结构可以获取我们想要的信息。接下来爬取新闻的标题、时间、来源、内容、责任编辑。import requestsfrom bs4 import Beautif...原创 2020-04-13 18:24:30 · 3152 阅读 · 1 评论 -
LSA/LSI算法原理和实践
目录:1、使用场景2、优缺点3、算法原理3.1、传统向量空间模型的缺陷3.2、Latent Semantic Analysis (Latent Semantic Indexing)3.3、算法实例4、文档相似度的计算5、对应的实践Demo目录:1、使用场景文本挖掘中的主题模型。聚类算法关注于从样本特征的相似度方面将数据聚类。比如通过数据样本之间的欧式距离,曼哈顿...转载 2020-04-06 00:13:44 · 4056 阅读 · 2 评论