ROC 曲线 & AUC
横坐标为假正,纵坐标为真正

越接近1越好,(0,0)表示都预测成负,(1,1)表示都预测成正
而FPR(False Positive Rate)= FP /(FP + TN),即负类数据被分为正类的比例
TPR(True Positive Rate)= TP /(TP + FN),即正类数据被分为正类的比例
AUC(Area Under Curve)被定义为ROC曲线下与坐标轴围成的面积,显然这个面积的数值不会大于1。 又由于ROC曲线一般都处于y=x这条直线的上方,所以AUC的取值范围在0.5和1之间。 AUC越接近1.0,检测方法真实性越高;等于0.5时,则真实性最低,无应用价值。
GMM 高斯混合模型
k 个高斯分布拟合样本分布,加权得到结果
EM算法:


本文探讨了机器学习中的关键评估指标,如ROC曲线及其AUC,解释了FPR和TPR的概念,并强调了AUC在判断模型性能中的作用。同时,介绍了GMM高斯混合模型,它是如何利用EM算法来拟合数据分布的。此外,还提及了xgboost作为提升算法的工作原理,强调了其在残差拟合上的应用。

最低0.47元/天 解锁文章
1020

被折叠的 条评论
为什么被折叠?



