Pandas数据处理实战:从异常值检测到函数应用
1. 异常值检测
在数据分析中,异常值检测是一个重要的环节。通过计算z分数,可以找出数据集中那些偏离正常范围的值。示例代码展示了如何检测z分数不在区间 [0.01, 2.5] 内的异常值。
# 代码省略,具体可参考相关示例
运行代码后,会输出数据集的基本信息、z分数以及上下异常值。以下是一个简单的输出示例:
=> iris_df.shape: (150, 4)
sepal length (cm) sepal width (cm) petal length (cm) petal width (cm)
0 5.1 3.5 1.4 0.2
...
=> upper outliers:
[3.09077525 2.63038172]
=> lower outliers:
sepal length (cm) sepal width (cm) petal length (cm) petal width (cm)
73 6.1 2.8 4.7 1.2
...
2. 绘制散点图
使用Pandas和Matplotlib可以方便地从DataFrame中生成散点图
Pandas数据处理与分析实战技巧
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



