文本分类之六分类结果评估

本文介绍了机器学习领域中用于评估算法效果的三个核心指标:召回率、准确率及F1分数,并提供了文本分类项目的评估代码示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

机器学习领域的算法评估有三个基本的指标。

  1. 召回率(Recall Rate,也叫查全率):是检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率。
    召回率=系统检索到的相关文档数/系统所有相关文档的总数
  2. 准确率(Precision,也称为精度):是检索出的相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率。
    准确率=系统检索到的相关文件/系统所有检索到的文件总数

注意:准确率和召回率是互相影响的,理想情况下肯定是做到二者都高,但是一般情况下,准确率高,召回率就低;反之亦然。

  1. F-Score:机器学习中常用的评价标准。其中,最常见的是F1-Measure,公式为:F1=2PR/(P+R)
    文本分类项目的分类结果评估,代码如下:
from sklearn import metrice
def metrics_result(actual, predict):  
    print '精度:{0:.3f}'.format(metrics.precision_score(actual, predict,average='weighted'))  
    print '召回:{0:0.3f}'.format(metrics.recall_score(actual, predict,average='weighted'))  
    print 'f1-score:{0:.3f}'.format(metrics.f1_score(actual, predict,average='weighted'))  
  
metrics_result(test_set.label, predicted) 

注意:单独运行这个代码会报错,把这一部分加到贝叶斯模型的程序中运行,就可以得到正确的结果。

转载于:https://www.cnblogs.com/sanmenyi/p/7040400.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值