数据处理流程

数据规范化

快速查看数据是否存在缺失值

.T  矩阵中转质    把行变成列,   把列变成行

实例代码
import numpy as np
data = np.matrix([[1,2,3],
				[4,5,6]])
data.T

([[1,4],
  [2,5],
  [3,6]])
 
 123本来是行变成了列
 
I 转质

explore = data.describe(percentiles = [], include = 'all').T    #包括对数据的基本描述,percentiles参数是指定计算多少的分位数表(如1/4分位数、中位数等);T是转置,转置后更方便查阅
——————————————————————————————————————————————————————————

II 构建一个新字段,用数据得长度-describe的长度

explore['null'] = len(data)-explore['count'] #describe()函数自动计算非空值数,需要手动计算空值数
————————————————————————————————————————————————————————————————
III  构建号了以后 只取出里面的空,最大值,最小值3个值

explore = explore[['null', 'max', 'min']]
explore.columns = [u'空值数', u'最大值', u'最小值'] #表头重命名


标准化数据
(data-mean)/ std

聚类评级
(b-a)
————
max(ab)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值