
模型评估与模型选择
RLilyX
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
聚类算法评估
1、调整兰德指数(Adjusted Rand Index)兰德指数需要给定类别信息C,假设K是聚类结果,兰德指数表达式如下a为在C中为同一类且在K中也为同一类别的数据点对数b为在C中为同一类但在K中却隶属于不同类别的数据点对数c为在C中不在同一类但在K中为同一类别的数据点对数d为在C中不在同一类且在K中也不属于同一类别的数据点对数RI的取值范围为[0,1],值越大意味着聚类结果与真实...原创 2018-12-03 22:15:26 · 1563 阅读 · 0 评论 -
多分类模型评价方法
1、准确率metrics.accuracy_score(y_true=y_true, y_pred=y_pred)2、平均准确率针对不平衡数据,对n个类,分别计算每个类别的准确率,然后求平均值。metrics.average_precision_score(y_true=y_true, y_score=y_pred)3、基于相似度的评价指标3.1 log-loss指示矩阵Y(N...原创 2019-01-18 08:00:57 · 10922 阅读 · 0 评论 -
二分类模型评价方法
二分类模型是输出只有0,1的分类模型。本文介绍二分类模型的评价指标。from sklearn import metricsy_pred = [0, 1, 0, 0] #模型的预测输出y_true = [0, 1, 0, 1] #真实值二分类模型中可能的分类结果如下图的混淆矩阵,混淆矩阵涵盖了二分类模型所有可能的输出。Sklearn计算混淆矩阵metrics.confusion_m...原创 2019-01-16 22:17:29 · 6745 阅读 · 0 评论 -
多标签模型评价方法
每一个事物可能对应多个标签,例如一个人的身份可以是学生、老师、歌手等多重身份。1、基于相似度的评价指标1.1 hamming_lossmetrics.hamming_loss(np.array([[0, 1], [1, 1]]), np.zeros((2, 2)))1.2 jaccard_similarity_scoremetrics.jaccard_similarity_score...原创 2019-01-18 22:30:51 · 1861 阅读 · 0 评论