文本分类系统:深度学习算法的应用与实现
1. 文本分类系统架构概述
文本分类系统采用卷积文本分类器,所采用的机器学习算法经过改进成为深度版本。在设计文本分类系统时,涉及到池化层和卷积层的运用。
- 池化层 :
- 若输入数据为数值向量,池化层的作用是对输入向量进行降维。
- 若输入数据为文本,则通过关键词提取和文本摘要的方式实现文本降维。关键词提取从文本中提取重要词汇列表,文本摘要提取部分段落作为摘要,从而将文本缩小为更小的文本。
- 卷积层 :卷积层的作用是从单个训练示例生成更多训练示例。
- 若使用单个滤波器,卷积层类似于池化层;若使用多个滤波器,则从输入向量或矩阵生成多个向量或矩阵。
- 在文本卷积中,通过多次随机分区选择从输入文本生成多个文本,其效果是对文本进行降维并生成多个文本。
实现文本分类系统可采用两种方式:
- 采用现有机器学习算法,并安装池化层和卷积层。
- 采用深度学习算法。若采用现有机器学习算法,样本文本通过文本深度操作映射为其他形式,映射后的文本编码为数值向量,再通过数值深度操作映射为其他向量,最后使用最终映射的数值向量训练机器学习算法。在实现文本分类系统时,可选择单个或多个机器学习算法。
设计基于深度学习算法的文本分类系统时,添加池化层可减少数值向量的维度和稀疏性,添加卷积层可减少维度并生成人工训练示例。可选择现有机器学习算法与池化层、卷积层结合,
超级会员免费看
订阅专栏 解锁全文

1878

被折叠的 条评论
为什么被折叠?



