0. 写在前面
计算语言学,这种偏向工科的文科名字,又该怎么定义语言呢?语言的形式有是什么样子?怎么才能形式化语言以使得计算呢?自动机是什么东西,和图灵机有关系么?说了这么多有什么用呢?这一个个疑问,我们将会在接下来的讲解中,为大家一一介绍。
1. 语言
谈到语言,想必是仁者见仁,智者见智。从社会学角度来说,是人类最重要的交际工具,是人们进行沟通交流的主要表达方式。人们借助语言保存和传递人类文明的成果。语言是民族的重要特征之一。从生物学上讲,语言是指生物同类之间由于沟通需要而制定的具有统一编码解码标准的声音(图像)指令。而根据乔姆斯基的语言定义,则是认为,语言是按照一定规律构成的句子和符号串的有限或无限的集合。
既然可以计算,那么首先它得能够描述。当然这种描述肯定不能是原生态的,一定是要能计算的,也就是说使用数学方法来描述。一般的,一种语言有三种描述方式:
- 穷举法
这种方法就是把语言中所有的句子都枚举出来,显然只是一种理想的模型。 - 文法描述
这种方法通过严格定义的规则来构造语言中的每个合法句子,是一种生成式系统。 - 自动机法
这种方法是对一个句子进行合法性检验,当然也是通过一种逻辑推理系统,