
Python数据分析与挖掘实战
《Python数据分析与挖掘实战》中的实际案例
静水``流深
这个作者很懒,什么都没留下…
展开
-
Chapter 15 电商产品评论数据情感分析
一、背景和目标本文对电商平台上的热水器评论进行文本挖掘分析,本次数据挖掘的建模目标如下:分析某一品牌热水器的用户情感倾向。 从评论文本中挖掘出该品牌热水器的优点和不足。 提炼不同品牌热水器的卖点。二、方法步骤利用爬虫工具——八爪鱼采集器,对京东商城进行热水器评论的数据采集。 对获取的数据进行基本的处理操作,包括数据预处理、中文分词、停用词过滤等。 文本评论数据经过处理后,运用多种手段对评论数据进行多方面的分析。 从对应结果的分析中获取文本评论数据中有价值的内容。三、过程3.1原创 2020-07-08 18:02:26 · 2113 阅读 · 0 评论 -
Chapter 14 基于基站定位数据的商圈分析
一、数据抽取从运营商得到位置数据,以2014-1-1到2014-6-30为分析的观测窗口,抽取该期间内某地的定位数据作为建模数据。二、数据探索分析三、数据预处理3.1 数据规约原始数据属性较多,这里只选择相关的属性:日期、时间、基站编号、EMASI号进行分析。3.2 数据变换挖掘目标是寻找出高价值的商圈,一般高价值的商圈具有人流量大、人均停留时间长的特点。但是工作的写字楼、休息的住宅区停留时间也较长,仅仅通过停留时间作为人流特征难以区分高价值商圈和写字楼与住宅区。(1)根据所原创 2020-07-08 17:59:13 · 1355 阅读 · 0 评论 -
Chapter 11 应用系统负载分析及磁盘容量预测
目录一、数据预处理1.11 代码:1.12 结果:二、模型建立2.1平稳性检验2.11 代码:2.12 结果:2.2 白噪声检验2.21 代码:2.22 结果:2.3 模型的识别2.31 代码:2.32 结果:2.4 模型的检验2.41 代码:2.42 结果:2.5 模型的评价2.51 代码:2.52 结果:三、...原创 2020-07-08 17:32:49 · 1325 阅读 · 0 评论 -
Chapter 10 家用电器用电行为分析与事件预测
一、背景与目标二、方法步骤三、过程3.1 数据抽取3.2 数据探索分析3.3 数据预处理3.31 数据规约属性规约 数值规约3.32 数据变换(1)一次完整用水事件的划分模型#-*- coding: utf-8 -*-#用水事件划分import pandas as pdthreshold = pd.Timedelta('4 min') #阈值为分钟inputfile = '.../data/water_heater.xls' #输入数据路径,需要使用Exc原创 2020-07-18 00:09:52 · 880 阅读 · 0 评论 -
Chapter 9 基于水色图像的水质评价
一、样本数据采集从采集到的原始水样图像中进行选择性抽取和实时的抽取,形成建模数据和增量数据。二、数据预处理2.1 图像切割用其他编程软件进行编程,切割水样图像中央101*101像素的图像。若原始图像大小为M*N,则截取宽从宽从(M/2-50)到(M/2+50),长度从 (M/2-50) 到 (M/2+50) 个像素点的子图像。2.2 颜色矩特征提取构造出特征:RGB各颜色的一阶颜色矩 RGB各颜色的二阶颜色矩 RGB各颜色的三阶颜色矩三、构建专家样本根据已完成预处理的建原创 2020-07-08 17:59:48 · 768 阅读 · 0 评论 -
Chapter 8 中医证型关联规则挖掘
一、背景和目标二、总体方法三、过程3.1 数据获取3.2 数据预处理3.21 数据清洗3.22 属性规约3.23 数据变换(1)属性构造(2)数据离散化#-*- coding: utf-8 -*-'''聚类离散化,最后的result的格式为: 1 2 3 4A 0 0.178698 0.257724 0.351843An 240 356.000000 28原创 2020-07-08 18:00:25 · 2400 阅读 · 0 评论 -
Chapter 7 航空公司客户价值分析
此案例来自《Python 数据分析与挖掘实战》数据说明:航空公司的会员档案信息集其乘坐记录建模目标:1)借助航空公司客户数据,对客户进行分类2)对不同的客户类别进行特征分析,比较不同类客户的客户价值3)对不同价值的客户类别提供个性化的服务,制定相应的营销策略原创 2020-07-08 17:29:46 · 892 阅读 · 0 评论 -
Chapter 6 电力窃漏电用户自动识别
一、数据抽取二、数据探索2.1 分布分析对各个用电类别的窃漏电用户情况,作条形图。2.2 周期性分析对每天的用电情况,作折线图。2.2.1 正常用电电量周期性分析2.2.2 窃漏电用户电量周期性分析三、数据预处理3.1 数据清洗3.2 缺失值处理# -*- coding: utf-8 -*-# 拉格朗日插值代码import pandas as pd...原创 2020-07-08 17:58:23 · 701 阅读 · 0 评论