语言处理:从词嵌入到情感分析
1. 语言处理基础与词嵌入的兴起
在语言处理领域,传统方法如TF - IDF和n - gram能利用少量示例创建语言模型,将短语编码为单字独热编码序列有助于有效使用循环神经网络(RNN)。然而,使用词嵌入是一种更快速处理文本数据并创建强大深度学习模型的方法。
词嵌入有着悠久的历史,其概念最早出现在统计多元分析中的多元对应分析。自20世纪70年代起,法国统计学家和语言学家Jean - Paul Benzécri以及法国数据分析学派的众多研究人员发现了如何将有限的词汇集映射到低维空间(通常是二维表示,如地形图),这一过程将单词转化为有意义的数字和投影,为语言学、社会科学带来诸多应用,并为深度学习在语言处理中的发展铺平了道路。
2. 神经网络处理数据的挑战与词嵌入的优势
神经网络在处理数据和寻找最佳权重以实现准确预测方面速度极快,从卷积神经网络(CNN)到循环神经网络(RNN)都是如此。但它们在处理数据时存在一些局限性,例如需要对数据进行归一化处理,以确保网络正常工作,或限制输入值范围在0到 + 1或 - 1到 + 1之间,以减少更新网络权重时的问题。
归一化可以通过激活函数(如tanh,将值压缩到 - 1到 + 1的范围)或专门的层(如BatchNormalization,对层间传递的值进行统计变换)在网络内部完成。
另一个神经网络难以处理的问题是稀疏数据。当数据大多由零值组成时,就会出现稀疏数据,在使用频率或二进制编码处理文本数据时就会出现这种情况。处理稀疏数据时,神经网络不仅难以找到良好的解决方案,而且输入层需要大量的权重,因为稀疏矩阵通常很宽(列数很多)。
为了解决
超级会员免费看
订阅专栏 解锁全文
552

被折叠的 条评论
为什么被折叠?



