1 基本概念
BOX-COX变换是由博克斯与考克斯在1964年提出的一种应用非常广泛的变换,是对因变量y做如下变换:


BOX-COX变换是一个幂变换族,λ=0时,成为对数变换。
从概率分布角度看,当数据本身服从对数正态分布时,对数据做对数变换后其就服从正态分布。对数正态分布是右偏分布,有厚重的右尾。
从数据看,如果数据中一些数值很大,但是小数值的数据更密集,个数更多,大数值数据较稀疏,个数较少,这样的数据很可能服从对数正态分布,可以尝试对其做对数变换。
对于回归问题,可以考虑只对因变量做对数变换或者只对自变量做对数变换,或者同时对因变量和自变量做对数变换。
2 python实现
数据准备:

最低0.47元/天 解锁文章
609

被折叠的 条评论
为什么被折叠?



