熵代表的是随机变量的不确定度
熵越大,数据的不确定性越高
熵越小,数据的不确定性越低
基尼系数
基尼系数越高,数据的不确定性越强
基尼系数越低,数据的不确定性越低
生成式模型与判别式模型
生成式:是根据数据的联合概率分布,以及边缘分布,根据二者的关系求出数据的条件概率模型,这个条件概率模型就是预测模型
典型的生成模型:
朴素贝叶斯、隐马尔可夫、混合高斯
判别式:根据数据直接学习出一个决策函数或者是一个条件概率分布
典型的判别模型:
KNN,感知机,决策树,逻辑回归,最大熵模型,SVM,提升方法,条件随机场,神经网络
8243

被折叠的 条评论
为什么被折叠?



