文本分类(课堂笔记)

这次的文章是根据牛津大学的公开课深度学习NLP中关于文本分类的课堂笔记(其实就是一些截图了,因为后来发现这个课程比较基础)。
原视频看这里:https://www.bilibili.com/video/av9817911/?p=7

首先,文本分类都有什么类型呢?
二值分类;
单标签分类;
多标签分类;
聚类(无标签)

那么分类都有哪些方法呢?各有什么优缺点?
这个比较简单,直接截图吧。
这里写图片描述

我们常用的便是基于statistical的文本分类方法。可以把这个问题表示为P(c|d), d 代表文本的表征,c代表文本的类别。
现在我们就可以把文本分类拆分成两个步骤:
表征文本;
求出文本属于类别c的概率

那表示文本的方法有哪些呢?
这里写图片描述

求概率的模型又有哪些呢?
这里写图片描述

下面列举几个常见的模型以及其优缺点:
朴素贝叶斯:
这里写图片描述

逻辑回归:
这里写图片描述

CNN:
这里写图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值