本篇博文仅仅用于自己学习的笔记,若有错误欢迎指正。
参考:
论文:Convolutional Neural Networks for Sentence Classification
代码:https://github.com/dennybritz/cnn-text-classification-tf
Model(模型):
模型结构图:
模型思路:
- 令 x i ∈ R k x_i∈R^k xi∈Rk表示一个句子的第i个词的词向量;句子长度用n表示,对于长度不是n的进行相应的填充与截断; x i : n = x 1 ⊕ x 2 ⊕ … . ⊕ x n x_{i:n}=x_1⊕x_2⊕….⊕x_n xi:n=x1⊕x2⊕….⊕xn表示一个句子⊕是串联操作, x i : i + j x_{i:i+j} xi:i+j就是 x i , x i + 1 , … , x i + j {x_i,x_{i+1},…,x_{i+j}} xi,x

该博客介绍了如何使用卷积神经网络(CNN)进行句子分类,详细阐述了模型结构,包括词向量表示、卷积操作、最大池化层和正则化策略。模型变种涉及静态和可训练的二维句子向量的结合,并在倒数第二层应用dropout以提高泛化能力。此外,还讨论了L2正则化和权重约束以防止过拟合。
最低0.47元/天 解锁文章
2619

被折叠的 条评论
为什么被折叠?



