自然语言处理及其应用概述
1. 自然语言处理的定义与挑战
语言是人类区别于其他动物的重要特征之一,人类的逻辑思维以语言形式呈现,绝大多数知识也通过语言记录和传承。自然语言处理(Natural Language Processing,NLP)是一门融合了语言学、计算机科学和数学的学科,它致力于研究利用自然语言实现人类与计算机有效沟通的各种理论和方法。
1.1 定义
自然语言是人们日常使用且随社会发展而演变的语言,而处理则涵盖了对词、实体、句子、章节、主题、知识等不同粒度输入的识别、分析、转换、理解、推理和生成等操作。自然语言处理的目标是让机器像人类一样智能地理解语言,缩小人类交流(自然语言)与计算机理解(机器语言)之间的差距。
1.2 挑战
自然语言处理面临着诸多挑战,主要体现在抽象性、组合性、歧义性、演变性、非标准化、主观性、知识要求和可移植性困难等方面,具体如下表所示:
| 挑战 | 解释 | 示例 |
| — | — | — |
| 抽象性 | 许多抽象名词难以理解和表达 | 价值、尊严、权利 |
| 组合性 | 自然语言组合能产生大量语义 | 难说、不好说、不说好 |
| 演变性 | 自然语言随社会发展不断变化 | 古今词义不同 |
| 非标准化 | 与代码相比,自然语言难被程序理解 | “If, then” → “if … then …” |
| 主观性 | 不同人对同一表达理解不同 | 加适量味精 |
自然语言是对世界底层物理感知的复杂模型,代表着人类对世界万物及其关系的理解,是一套完整的符号描述体系。这意味着自然语言处理技术需直接处
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



