- 基本信息
书名:《Python数据分析与挖掘实战》
作者:张良均 王路 谭立云 苏剑林
出版社:机械工业出版社
- 主要内容
基础部分:
介绍了数据挖掘的过程、python数据分析简介、数据探索、预处理和建模。
实战部分:
1.电力窃漏点用户自动识别
采用方法:拉格朗日插值法、LM神经网络、CART决策树。
特征构造:电量趋势下降指标(斜率)
2.航空公司客户价值分析
采用方法:k-means聚类
特征构造:采用的原始特征值相减的方法(例如:L=LOAD_TIME-FFP_DATE 会员入会时间距观测窗口结束的月数 = 观测窗口的结束时间-入会时间)
3.中药证型关联规则挖掘
采用方法:Apriori算法处理
4.基于水色图像的水质评价
采用方法:支持向量机(SVM)
特征构造:颜色矩特征,图像分割。
5.家用电器用户行为分析与事件识别
采用方法:BP神经网络
特征构造:斜率
6.应用系统负载分析与磁盘容量预测
采用方法:ARMA时序模型
7.电子商务网站用户行为分析及服务推荐
采用方法:协同过滤推荐算法
8.财政收入影响因素分析及预测模型
采用方法:灰色预测与神经网络组合模型
特征构造:Adaptive-Lasso变量选择
9.基于基站定位数据的商圈分析
采用方法:层次聚类
10.电商产品评论数据情感分析
采用方法:八爪鱼爬虫工具,word2vec,ROSTCM6(由武汉大学开的一款免费反剽窃系统),LDA模型主题分析
- 小结
本书重点在怎么做上面,是一本非常好的练习手册,搭配完善的python代码,能够快速入门上手。总的来说,本书非常基础。但适合当成一本字典,需要时可以快速查阅。