1 基本概念

BOX-COX变换是由博克斯与考克斯在1964年提出的一种应用非常广泛的变换,是对因变量y做如下变换:

Python实现BOX-COX变换_python

Python实现BOX-COX变换_方差_02

BOX-COX变换是一个幂变换族λ=0时,成为对数变换

从概率分布角度看,当数据本身服从对数正态分布时,对数据做对数变换后其就服从正态分布。对数正态分布是右偏分布,有厚重的右尾。

从数据看,如果数据中一些数值很大,但是小数值的数据更密集,个数更多,大数值数据较稀疏,个数较少,这样的数据很可能服从对数正态分布,可以尝试对其做对数变换。

对于回归问题,可以考虑只对因变量做对数变换或者只对自变量做对数变换,或者同时对因变量和自变量做对数变换。

2 python实现

数据准备: