RCNN文本分类与tensorflow实现

1. 引言

    前面介绍了LSTM_CNN文本分类模型,虽然在CNN前加上一层LSTM层,可以提取文本中的序列信息,但是当文本的长度比较长时,LSTM提取信息的能力是有限的,并且,在LSTM中,每个词汇对应的隐藏状态都只包含了前面序列的信息,而没有考虑到后续序列的信息(BiLSTM除外),因此,本文将介绍一个新的模型结构,该结构采用一种递归CNN的形式,即每个词汇的向量表示既包括了其本身的词向量,也包括其前面序列和后面序列的上下文向量,从而使得每个词汇的向量信息更加丰富。

2. RCNN模型介绍

2.1 RCNN模型的结构

    首先,对于每一个文本D,用一串词汇序列w _ { 1 } , w _ { 2 } \ldots w _ { n }表示,并且记该文本属于某一类别k的概率为p ( k | D , \theta ),其中,\theta表示模型中的参数。RCNN模型主要包含三部分,分别是递归CNN层、max-pooling层、输出层。

    在递归CNN层,对于每个词汇,RCNN会递归地计算其左侧上下文向量和右侧上下文向量,然后将这两部分向量与当前词汇的词向量进行拼接作为该词汇的向量表示,如图1所示。记c _ { l } \left( w _ { i } \right)c _ { r } \left( w _ { i } \right)分别为词汇w _ { i }的左侧上下文向量和右侧上下文向量,它们都是长度为| c |的实数向量,计算公式分别如下:

                                                      \begin{array} { l } { c _ { l } \left( w _ { i } \right) = f \left( W ^ { ( l ) } c _ { l } \left( w _ { i - 1 } \right) + W ^ { ( s l ) } e \left( w _ { i - 1 } \right) \right) } \\\\ { c _ { r } \left( w _ { i } \right) = f \left( W ^ { ( r ) } c _ { r } \left( w _ { i + 1 } \right) + W ^ { ( s r ) } e \left( w _ { i + 1 } \right) \right) } \end{array}

其中,

# 工程内容 这个程序是基于tensorflow的tflearn库实现部分RCNN功能。 # 开发环境 windows10 + python3.5 + tensorflow1.2 + tflearn + cv2 + scikit-learn # 数据集 采用17flowers据集, 官网下载:http://www.robots.ox.ac.uk/~vgg/data/flowers/17/ # 程序说明 1、setup.py---初始化路径 2、config.py---配置 3、tools.py---进度条和显示带框图像工具 4、train_alexnet.py---大数据集预训练Alexnet网络,140个epoch左右,bitch_size为64 5、preprocessing_RCNN.py---图像的处理(选择性搜索、数据存取等) 6、selectivesearch.py---选择性搜索源码 7、fine_tune_RCNN.py---小数据集微调Alexnet 8、RCNN_output.py---训练SVM并测试RCNN(测试的时候测试图片选择第7、16类中没有参训练的,单朵的花效果好,因为训练用的都是单朵的) # 文件说明 1、train_list.txt---预训练数据,数据在17flowers文件夹中 2、fine_tune_list.txt---微调数据2flowers文件夹中 3、1.png---直接用选择性搜索的区域划分 4、2.png---通过RCNN后的区域划分 # 程序问题 1、由于数据集小的原因,在微调时候并没有像论文一样按一个bitch32个正样本,128个负样本输入,感觉正样本过少; 2、还没有懂最后是怎么给区域打分的,所有非极大值抑制集合canny算子没有进行,待续; 3、对选择的区域是直接进行缩放的; 4、由于数据集合论文采用不一样,但是微调和训练SVM时采用的IOU阈值一样,有待调参。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值