文本挖掘与分析第五周学习笔记2--评估文本分类结果

最新推荐文章于 2025-01-05 16:17:53 发布

原创

最新推荐文章于 2025-01-05 16:17:53 发布 · 1.3k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#精确度 #召回率 #评价分类结果 #混淆矩阵

本文介绍了评估文本分类结果的方法，包括分类正确率、精确度和查全率，强调了精确度和查全率在不同场景下的重要性。通过宏平均和微平均分析了衡量分类性能的视角，并讨论了排名评估在某些应用场景中的必要性，如垃圾邮件过滤和新闻分类。最后，强调了选择评估指标应根据应用需求和用户效用进行权衡。

如何评估分类结果：

方法：Cranfield创造检验校正：
ground truth:可以重复检验不同的系统，进行比较。
比较系统分类的结果
比较系统决策：哪个文档应该属于哪个分类；作者设定了哪些分类给文档
量化决定的相似度；等价衡量系统输出和理想输出之间的不同
比较方法时可以不考虑误差差异，允许误差的存在。
这里写图片描述

分类正确率：衡量正确决定率的基础

人决定：正确（+）；错误（-）
系统决定：正确（Y）；错误（N）
分类正确率=人决定和系统决定相同的个数/总的决定个数=Y（+）+N（-）/KN
分类正确率越大越好
这里写图片描述
缺点：
平均审视每一个决定：错误的种类可能不同，不能平均审视。例如：合法邮件被丢弃远比垃圾邮件被接收更令人无法接受，因为垃圾邮件还是可以接受收到。

所以使用分类正确率作为准则，要确保分类上司平衡的。

使用其他角度方法：精

最低0.47元/天解锁文章

新学期VIP享超值加赠

博客等级

码龄8年

20
原创

184
点赞

718
收藏

150
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 文本挖掘与分析第五周学习笔记1--文本分类器

下一篇：: 文本挖掘与分析第五周学习笔记3--意见挖掘和情感分析

最新评论

机器学习/算法工程师面试题目与答案-深度学习部分1
优快云-Ada助手: 推荐 Python入门技能树：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python
医学信息学复习
于春莉: 加一求一下
生理学知识点总结--biologic
Mymx73: 引用「钠钾泵」想问一下一个问题，就是细胞外钾离子升高或者细胞内钠离子增多会不会导致钠钾泵抑制呢
生理学知识点总结--biologic
m0_74051853: 你好，你总结的太好啦，我是一个医学生，今年学生理学，这个对我帮助好大！可以分享电子版吗（如果可以的话），非常感谢~~
优先级调度算法
海非天蓝: 1. 动态优先权：每次计算任务的优先级都会消耗一部分额外的计算资源，针对大量的周期性任务来说，静态的优先级反而会比较适合，有利于降低处理器的额外资源消耗， 2. 抢占式调度，每次的抢占都会导致任务的中断和挂起，严重影响处理器的性能但是动态可抢占式调度比较灵活，并且能保证高优先级任务的实时性，适合比较那种存在突发任务并且要求硬实时系统。所以非抢占式静态优先权有没有实际意义应当视具体情况而定，不能一概而论

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。