目录
统计建模
Box-Cox变换
https://zhuanlan.zhihu.com/p/36284359
要对数据进行分析的时候,会发现数据有一些问题使得我们不能满足我们以前分析方法的一些要求(正态分布、平稳性)为了满足经典线性模型的正态性假设,常常需要使用指数变换或者对数转化,使其转换后的数据接近正态,
box-cox变换的目标有两个:
一个是变换后,可以一定程度上减小不可观测的误差和预测变量的相关性。主要操作是对因变量转换,使得变换后的因变量于回归自变量具有线性相依关系,误差也服从正态分布,误差各分量是等方差且相互独立。
第二个是用这个变换来使得因变量获得一些性质,比如在时间序列分析中的平稳性,或者使得因变量分布为正态分布。
时间序列分析tsa包中的实现是BoxCox.ar
=======
https://cloud.tencent.com/developer/article/1010877
优势:
- 线性回归模型满足线性性、独立性、方差齐性以及正态性的同时,又不丢失信息,此种变换称之为Box—Cox变换。
- 误差与y相关,不服从正态分布,于是给线性回归的最小二乘估计系数的结果带来误差
- 使用Box-Cox变换族一般都可以保证将数据进行成功的正态变换,但在二分变量或较少水平的等级变量的情况下,不能成功进行转换,此时,我们可以考虑使用广义线性模型,如LOGUSTICS模型、Johnson转换等。
- Box-Cox变换后,残差可以更好的满足正态性、独立性等假设前提,降低了伪回归的概率
知识库
一个易用、易部署的Python遗传算法库
最大似然估计(MLE)、最大后验概率估计(MAP),与贝叶斯估计
https://blog.youkuaiyun.com/u011508640/article/details/72815981
新手数据科学家最容易踩的5个坑,来看看你有没有中招
http://km.oa.com/group/43297/articles/show/439562?kmref=dailymail_todayposts&jumpfrom=daily_mail