【总结】TextCNN补充
TextCNN
TextCNN可以调整哪些参数?
1、卷积和大小,一个合理的值范围在1~10. 若输入文本句子较长,可以考虑更大的卷积核;并行卷积的数量,可以在寻找到最佳的卷积核尺寸后,在该尺寸附近寻找其他的合适值来进行组合,实践证明这样的组合效果往往比单个最佳的卷积核表现更好,而且,网络对文文本,网络设计越宽,效果可能更好。
2、特征图的个数;这个参数为影响最终特征的维度,维度太大训练会变慢,合理的值在100~600之间即可。
3、正则化项,当特征图数量增加时,有过拟合风险,可以加强正则效果,比如dropout提高超过0.5;
textCNN中卷积核的长与款代表了什么?
在TextCNN中,卷积核不是一个正方形,是一个宽和word embedding相同、长表示核大小的窗口。
TextCNN多个不同大小的卷积核,往往是(3, 4, 5)这种类型。每一种大小的卷积核也会使用很多个。
在TextCNN中的pooling操作与一般CNN的pooling操作有何不同?
TextCNN中用的是最大池化(1-Max pooling),但是可以多保留k个最大信息。pooling阶段保留 k 个最大的信息,保留了全局的序列信息。
举个例子:
“我觉得这个地方景色还不错,但是人也实在太多了 ”
虽然前半部分体现情感是正向的,全局文本表达的是偏负面的情感,利用 k-max pooling能够很好捕捉这类信息。
TextCNN的局限性?
TextCNN是很适合中短文本

本文总结了TextCNN的相关内容,包括可调整的参数,如卷积核大小和数量,以及特征图的个数。TextCNN中卷积核长与款对应窗口大小,常用(3, 4, 5)。与一般CNN不同,TextCNN采用最大池化并保留k个最大值以保持序列信息。然而,TextCNN在处理长文本时表现不佳,因为它无法捕获长距离特征。为了解决长文本分类,文章提及了DPCNN和RNN结构+attention作为替代方案。"
107068729,4626155,C语言文件位置操作:获取与设置,"['C语言', '文件操作', '文件位置', '文件读写']
最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



