孤立点outlier的意义

本文探讨了孤立点(异常值)在统计分析中的作用及其对回归分析、主成分分析及聚类分析的影响。作者还讨论了是否应该从数据集中移除这些孤立点,并分析了这种做法背后的价值观考量。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

关于孤立点的思考也有一段时间了,但是也没怎想出头绪。
实际的数据中总是有异常点(孤立点)存在,数据的期望,方差
E,V. 而且在作回归分析,主成分分析,聚类分析的时候效果都会
受到孤立点(异常点)的影响。

孤立点的存在是事实,但是我们做统计分析的时候总是想要把他们
从数据中剔出到,来提高统计分析的效果,为什么这样做呢?

这又涉及到了价值观的问题,是多数决定整体还是少数决定整体?
或者说是多数决定趋势,还是少数决定趋势?

从数据中剔出孤立点,是因为我们认为他们不代表整体,反而会对整体
的统计结果造成不好的影响,真的是这样吗?

举个例子:一群收入平均收入是10000的人群,突然来个100B的人,他们
的平均收入会怎么样? 还要看这个人群的数量n了.

如果越南去个盖茨会怎样?

E,V的统计指标都是总体的特征的描述,当然这似乎也能反映出整体的
情况。

但是对于个人而言,或者对某个具体问题而言的意义是多少?
正如"是多数决定整体还是少数决定整体?或者说是多数决定趋势,还是
少数决定趋势?"

教课书上说,是人民创造了历史..................................
但是现在某个人单个创新就可以改变现在的历史........

孤立点是什么, 是与众不同的, 可以是最坏,也可使是最好, 可以是希特勒,
可以使斯大林, 但他们永远是大众水平的.

发现的孤立点, 可能你就发现了机会, 正因为他的异常可以给你带来不同,
当然可以是好的,也可以是坏的......

似乎我更喜欢做个 outlier 这样才能与众不同...

我的意思似乎还没有表达出来, 可能是我文字水平的问题, 也可能是这问题
本身就说不清.

Email: ariszh...@gmail.com    欢迎交流(无论同意 or 反对)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值