
数据分析/数据挖掘
文章平均质量分 76
第二人生2
这个作者很懒,什么都没留下…
展开
-
文档分类[女性,体育,文学,校园四类文本进行分类]
微博文档分类文档输入对文档进行分词加载停等词表计算单词权重生成朴素贝叶斯分类器使用分类器预测计算准确率整体代码朴素贝叶斯TF-IDF文档输入对文档进行分词 目标:对女性,体育,文学,校园这四类文本进行分类 在准备阶段里,最重要的就是分词。英文文档和中文文档所使用的分词工具不同。在英文文档中,最常用的是 NTLK 包。NTLK 包中包含了英文的停用词 stop words、分词和标注方法。import nltkword_list = nltk.word_tokenize(text) #分词nltk原创 2020-11-11 16:41:57 · 1359 阅读 · 1 评论 -
简单爬虫request请求
下载豆瓣 王祖贤的海报使用request请求URL得到返回结果将JSON格式转换成Python对象在response 里查看当前下载的图片网址下载保存图片# coding:utf-8# 下载豆瓣 王祖贤的海报import requestsimport jsonquery = '王祖贤'''' 下载图片 '''def download(src, id): dir = './' + str(id) + '.jpg' try: pic = requests.get(src, t原创 2020-11-11 10:49:45 · 209 阅读 · 0 评论 -
[机器学习的一些算法]
十大经典机器学习算法机器学习算法整理(内含代码)线性回归python实现Liner Regression 线性回归及Python代码Python实现多元线性回归决策树原理实例[判断男女](python代码实现)决策树算法(ID3)[实例判断是否去打羽毛球]逻辑回归python实现逻辑回归简单原理及python实现python实现逻辑回归python 实现支持向量机(SVM)...原创 2020-11-08 09:22:33 · 149 阅读 · 0 评论 -
七周成为数据分析师02-业务
@[业务]业务为什么业务重要?唯有理解业务,才能建立业务数据模型经典的业务分析指标指标模型未动,指标先行如果你不能衡量它,你就无法增长它。结构化、公式化、业务化销售指标、运营指标、市场指标、推动业务指标、机器学习指标、管理指标好的指标应该是比率好的指标应该带来显著效果好的指标不应该虚荣好的指标不应该复杂市场销售指标客户/用户生命周期用户价值RFM模型用户分群,营销矩阵产品运营指标AARRR用户获取用户活跃用户存留营收原创 2020-10-19 10:17:53 · 551 阅读 · 0 评论 -
七周成为数据分析师01-数据分析思维
数据分析思维为什么思维很重要数据分析思维的三种核心思维结构化将分析思维结构化结构化原则公式化案例用法业务化如何预估上海地区的共享单车投放量你的分析贴不贴合业务?一家销售公司业绩没有起色,对它进行分析总结数据分析思维技巧象限法多维法假设法案例指数法案例思考二八法对比法例子漏斗法如何在业务时间锻炼数据分析思维好奇心为什么啤酒与尿布是错的?为什么思维很重要What:三种核心思维Why:数据分析的思维技巧How:如何在业务时间锻炼分析能力数据分析思维的三种核心思维结构化将分析思维结构化将论点归原创 2020-10-18 19:49:28 · 628 阅读 · 0 评论 -
ML-决策树-泰坦尼克号
ML-决策树-泰坦尼克号流程代码项目总结流程1.数据加载2.数据特征3.数据预处理:均值填充,最大值填充4.特征选择5.构造ID3树6.决策树训练7.决策树预测8.准确率输出代码import pandas as pdfrom sklearn.feature_extraction import DictVectorizerfrom sklearn.tree import DecisionTreeClassifier# 数据加载train_data = pd.read_csv('原创 2020-10-08 21:23:08 · 217 阅读 · 0 评论