自然语言处理及发展历程
什么是自然语言处理
- In the broadest sense,NLP refers to any program that automatically processes human languages(从最广泛的意义上说,NLP指的是任何自动处理人类语言的程序 )
自然语言处理发展历程
Rule-based(symbolic) approach(1950s-1980s)
- NLP最古老的方法
- 基于人类开发的规则和词汇在解决歧义方面的挑战
- 但是对于一词多义解释性并不好
Statistical approach (traditional machine learning)(1980s-2000s)
- 逐渐被学术界和业界采用
- 使用概率模型
- 训练数据(标记好的语料库)
- 特征工程
- 训练参数模型
- 将模型应用于测试数据
Connectionist approach(Neural networks)(2000s-now)
- 深度学习优于统计方法
- 该领域不需要语言特征
- 非常大的神经网络模型
- 在庞大的原始文本上可以预训练