【总结】TextCNN补充
TextCNN
TextCNN可以调整哪些参数?
1、卷积和大小,一个合理的值范围在1~10. 若输入文本句子较长,可以考虑更大的卷积核;并行卷积的数量,可以在寻找到最佳的卷积核尺寸后,在该尺寸附近寻找其他的合适值来进行组合,实践证明这样的组合效果往往比单个最佳的卷积核表现更好,而且,网络对文文本,网络设计越宽,效果可能更好。
2、特征图的个数;这个参数为影响最终特征的维度,维度太大训练会变慢,合理的值在100~600之间即可。
3、正则化项,当特征图数量增加时,有过拟合风险,可以加强正则效果,比如dropout提高超过0.5;
textCNN中卷积核的长与款代表了什么?
在TextCNN中,卷积核不是一个正方形,是一个宽和word embedding相同、长表示核大小的窗口。
TextCNN多个不同大小的卷积核,往往是(3, 4, 5)这种类型。每一种大小的卷积核也会使用很多个。
在TextCNN中的pooling操作与一般CNN的pooling操作有何不同?
TextCNN中用的是最大池化(1-Max pooling),但是可以多保留k个最大信息。pooling阶段保留 k 个最大的信息,保留了全局的序列信息。
举个例子:
“我觉得这个地方景色还不错,但是人也实在太多了 ”
虽然前半部分体现情感是正向的,全局文本表达的是偏负面的情感,利用 k-max pooling能够很好捕捉这类信息。
TextCNN的局限性?
TextCNN是很适合中短文本