17、文本分类:原理、方法与应用

文本分类:原理、方法与应用

1. 文本分类概述

文本分类是自然语言处理(NLP)中的一个重要问题,它的任务是将对象从一个集合分配到两个或更多的类别或范畴中。在NLP中,许多任务都属于分类任务,如下表所示:

问题 对象 类别
标注 单词的上下文 单词的标签
消歧 单词的上下文 单词的词义
介词短语附着 句子 解析树
作者识别 文档 作者
语言识别 文档 语言
文本分类 文档 主题

文本分类的目标是对文档的主题或主题进行分类。例如,路透社文本集合使用了一组典型的主题类别,如“并购”、“小麦”、“原油”和“收益报告”等。文本分类的一个应用是为特定的兴趣群体过滤新闻流。

统计分类问题通常可以通过

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值