代码参考鸢尾花丛书开源代码,链接如下:
参考书籍及源代码链接
https://github.com/Visualize-ML
写在前面
离群值,即明显与其他数据差异较大的值(明显偏大&偏小),会对最大值、最小值、取值范围、平均值、方差等数据特征带来巨大偏差。
确定离群值最简单的方法是根据常识或专家知识,确定后将其删除或设为NaN然后进行填充。但只靠专家知识显然不行,需要一些定量方法。
导入必要的库和数据集:
代码参考鸢尾花丛书开源代码,链接如下:
参考书籍及源代码链接
https://github.com/Visualize-ML
离群值,即明显与其他数据差异较大的值(明显偏大&偏小),会对最大值、最小值、取值范围、平均值、方差等数据特征带来巨大偏差。
确定离群值最简单的方法是根据常识或专家知识,确定后将其删除或设为NaN然后进行填充。但只靠专家知识显然不行,需要一些定量方法。
导入必要的库和数据集:
3911

被折叠的 条评论
为什么被折叠?