
数据挖掘
文章平均质量分 92
Bing@DBA
专注于数据库和自动化领域的工程师
展开
-
酒店评论数据分析和挖掘-展现数据分析全流程(一)报告展示篇
本为应该会出四篇博客展现数据分析的整个流程(开源源码)数据报告成品展示(本文)描述性数据分析关键字提取分析评论情感分类建模LDA主题模型分析下面是本文的写作框架:1. 分析背景1.1 分析原理—为什么选择分析酒店网络评论 随着互联网的发展, 我们的生活也愈加便捷, 网上购物及预订酒店和景点门票已是多少数人的选择。移动互联网时代,酒店业的市场更加风云变幻,其中最为显著......原创 2020-02-27 18:34:43 · 24914 阅读 · 39 评论 -
Python爬取新型冠状病毒新闻进行LDA主题分析-从概率的角度去看文学
为疫区人民祈福,向医护人员致敬!Hello大家好!我是 Fantasy!今天要给大家介绍到项目是爬取疫情新闻,然后进行分析,项目的功能具体如下:爬取疫情新闻进行词频统计绘制词云图进行LDA主题分析一、爬取疫情新闻过程展示大概需要几首歌的时间~数据展示源码解析我们这次的目标网站是 人民网首先导入我们需要的库import timeimport randomim...原创 2020-02-08 18:40:28 · 5356 阅读 · 24 评论 -
Python数据挖掘-基于杰卡德相似系数的相似新闻推荐
使用Jaccard系数计算新闻相似度, 实现相似新闻推荐最近想写一个推荐系统的Api, 有个性化推荐, 相似推荐, 热度推荐等, 于是就使用Django写了一个新闻网站来练习, 目前实现了一个简单相似新闻推荐,记录下来...原创 2019-11-28 19:21:53 · 1604 阅读 · 6 评论 -
数据挖掘篇: 使用决策树识别Python招聘信息所属类别(分支)
最近在分析Python招聘信息的数据, 使用职位描述分词来判断分类不是很精准, 于是打算使用分词构造一个特征, 然后使用决策树来分类(下次试试聚类算法), 这样误差会小很对, 可以让我们更加精准的完成一份高质量的数据报告.首先看看原始数据吧接下来我们要通过分词和人工识别来构建专家样本数据注: 原计划训练数据至少2000条, 然后先人工识别了100条就忍不住想试一试由于有20个特征...原创 2019-10-25 09:30:12 · 1264 阅读 · 3 评论