无监督学习的评估方法
1.Normalizedmutual information
度量2个聚类结果的相近程度
http://www.cnblogs.com/ziqiao/archive/2011/12/13/2286273.html
2.以sqrt(n)或者更小的随机subsampling出的样本去聚类 m次,看看有哪些点分类不太一致
改变聚类参数,达到比较结果
3.把无监督学习的结果带给一个有监督的任务来衡量
引入有监督的分类算法,例如决策树(信息增益作为Step1)
4. 类内越相近,类间越远越好
计算文本相似度,来确定分类类内类间距离

本文介绍了几种常用的无监督学习评估方法,包括Normalized mutual information用于度量两个聚类结果的相似度;通过随机子采样进行多次聚类以观察分类一致性;将无监督学习结果应用于有监督任务中进行评价;以及通过计算类内和类间距离来评估聚类效果。

被折叠的 条评论
为什么被折叠?



