自然语言处理及发展历程
什么是自然语言处理
- In the broadest sense,NLP refers to any program that automatically processes human languages(从最广泛的意义上说,NLP指的是任何自动处理人类语言的程序 )

自然语言处理发展历程
Rule-based(symbolic) approach(1950s-1980s)
- NLP最古老的方法
- 基于人类开发的规则和词汇在解决歧义方面的挑战
- 但是对于一词多义解释性并不好
Statistical approach (traditional machine learning)(1980s-2000s)
- 逐渐被学术界和业界采用
- 使用概率模型
- 训练数据(标记好的语料库)
- 特征工程
- 训练参数模型
- 将模型应用于测试数据
Connectionist approach(Neural networks)(2000s-now)
- 深度学习优于统计方法
- 该领域不需要语言特征
- 非常大的神经网络模型
- 在庞大的原始文本上可以预训练
本文概述了自然语言处理的发展历程,从符号规则(1950-1980年代)到统计机器学习(1980-2000年代),再到现代的深度连接主义(神经网络,2000年至今)。重点介绍了各阶段的特点与突破,如规则方法的局限与统计方法的进步,以及深度学习如何超越并推动领域的革新。
5万+

被折叠的 条评论
为什么被折叠?



