文本深度学习:从基础到实践
1. 深度学习概述
在自然语言处理的领域中,我们此前已经广泛运用了机器学习技术,涵盖主题建模、聚类、分类、文本摘要等多个方面,甚至词性标注器(POS - taggers)和命名实体识别器(NER - taggers)也是通过机器学习训练得到的。而现在,我们将开启对深度学习这一前沿机器学习形式的探索。
深度学习本质上是机器学习的一种,它借助受生物启发的结构来生成算法和架构,从而对文本执行各类任务,例如文本生成、分类以及词嵌入等。
神经网络可以被视作一种计算系统或机器学习算法,其架构大致受到大脑中生物神经元的启发。不过,由于我们对人类大脑的了解尚不全面,所以这里说的“启发”只是大致的。大脑的神经连接和结构确实对神经网络的一些基本构建模块产生了影响,比如感知机和单层神经网络。
神经网络通常由多个节点组成,这些节点执行数学运算,并通过连接相互交互。这种模型在某种程度上类似于大脑,节点代表神经元,连接则代表神经元之间的线路。不同的层可以执行不同类型的操作,一般包括输入层、多个隐藏层和输出层。
神经网络研究反过来也启发了认知研究,人们对利用神经网络来理解人类大脑也有浓厚的兴趣。神经网络可用于我们之前进行的大多数机器学习任务,如分类、聚类,以及为单词和文档创建向量表示。
在文本分析领域之外,神经网络也取得了显著的成功。在图像分类、计算机视觉、语音识别和医学诊断等方面,最先进的成果往往是由神经网络实现的。我们之前提到过使用神经网络生成词嵌入,在学习或训练完成后,我们将隐藏层中存储的值用作词嵌入。
实际上,深度学习只是多层神经网络的另一种称呼。由于当前大多数神经网络的架构倾向于使用多层结构,
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



