查漏补缺之(一)—— fasttext与TextCNN

最近查看自己的博客,发现自己居然没有 fasttext与TextCNN的相关博客,正可谓左青龙右白虎王朝马汉在中间,没有这两位怎么能行呢?午休之前安排!

但需要提前说明的是,本篇博客不深入探究Fasttext与TextCNN的细节,只是基于既有知识点进行拓展解释,以期触类旁通。

fastText

fastText的核心思想是:将整篇文档的词及n-gram向量叠加平均得到文档向量,然后使用文档向量做softmax多分类得到其所属的类别label。

image-20210317005310233

整个过程类似于CBOW,以下是两者的一些区别和联系:

fastText CBOW
作用 主要用于分类,也可用于词向量训练 主要用于训练词向量
输入 表征单个文档的多个单词及字符级n-gram特征,被embedding过 目标单词的上下文,被onehot编码过
过程 将一个句子所有词做平均,提取的是句子的特征,利用全部的n-gram去预测指定类别label 将window_size的上下文词的向量做平均,提取的是上下文词特征,然后根据周围词预测中心词
输出 目标词汇的概率分布 文档对应类别的概率分布
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值