- 博客(3)
- 收藏
- 关注
转载 关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
转http://www.cnblogs.com/chaosimple/p/4153167.html一、标准化(Z-Score),或者去除均值和方差缩放 公式为:(X-mean)/std 计算时对每个属性/每列分别进行。将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。实现时,有两种不同的方式:使用sklearn.prepro
2017-06-20 18:54:39
344
原创 时间序列建模过程
一、频谱分析 1.1. 时域分析 1.2. 频域分析 1.3. 小波分解二、时间序列分析 2.1. HP滤波器分解 2.2. 滑动均值滤波器分解三、时间序列建模 3.1. 时间序列平稳化 3.2 使用4种方法检验差分后的序列的平稳性 1)Augmented Dickey-Fuller检验 2)Phillips-Perron检验 3)KPSS检验
2017-06-20 16:41:51
2470
转载 hive优化
Hive痛点直击&经验分享 优快云:hive的使用场景有哪些?适合实时性强的分析场景使用么? 蒋守壮: Hive是建立在Hadoop上的数据仓库基础构架,它的最佳使用场合是大数据集的批处理作业,一般延迟性比较高,并不能够在大规模数据集上实现低延迟快速的查询,所以不适合实时性强的分析场景。不过目前Hive底层的计算框架除了支持原生的MapReduce,还支持Tez和Spark,这对提升Hive
2017-06-20 16:14:01
364
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅