Python数据分析

(一)异常值分析
箱型图分析

plt.figure()
plt.rc('font', size=13)
p = plt.boxplot(words_series.head(10),whis=1.5)
plt.show()

结合describe()函数查看数据的基本情况

words_series.head(10).describe()

以上两条结合起来过滤数据集中的无效数据。
(二)过滤指定值
Series指定值过滤(也可以过滤空值或nan值)

words_series[words_series != 1]

Dataframe过滤指定列的指定值

data[data['three']>5]

(三)贡献度分析:帕累托图
(待补充)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值