
机器学习
悦光阴
千万不要沉迷于那种轻易获得成就感的东西,恰恰相反,什么领域,越有挑战性、越难有成就,越应当往上面长期投资。
展开
-
翻译:MICE 算法
原文:miceforest: Fast Imputation with Random Forests in Python链式方程的多重插补(MICE,Multiple Imputation by Chained Equations)通过一系列迭代的预测模型来“填充”(插补)数据集中的缺失数据。在每次迭代中,将使用数据集中的其他变量来估算数据集中的每个指定的变量,这些迭代持续运行,直到满足收敛为止。MICE的算法如下图所示,这个过程会持续执行,直到所有指定的变量都被插补为止。如果出现插补的均值没有收敛的情翻译 2020-12-28 18:55:15 · 8770 阅读 · 0 评论 -
翻译:miceforest:使用Python中的随机森林进行快速插补
原文:miceforest: Fast Imputation with Random Forests in Pythonmiceforest 包实现随机森林的链式方程式(MICE)多重插补,具有快速、内存利用率高的特征,无需太多设置即可插入缺失的分类和数值数据,并且具有一系列可用的诊断图。一,miceforest包的组成miceforest 有4个主要的class:KernelDataSet:内核数据集是在其上执行mice算法的数据集,模型保存在实例内部,也可以调用该模型以插补新数据。有多种绘图方翻译 2020-12-28 17:34:59 · 11908 阅读 · 15 评论