计算语言学之形式语言与自动机

本文介绍了计算语言学中的形式文法和自动机,包括四种形式文法类型:正则文法、上下文无关文法、上下文有关文法和无约束文法。接着详细讨论了有限自动机、下推自动机、线性界限自动机和图灵机,并解释了它们如何对应不同的文法类型。此外,还探讨了自动机在自然语言处理中的应用,如单词拼写检查、单词形态分析和词性消歧。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

0. 写在前面

计算语言学,这种偏向工科的文科名字,又该怎么定义语言呢?语言的形式有是什么样子?怎么才能形式化语言以使得计算呢?自动机是什么东西,和图灵机有关系么?说了这么多有什么用呢?这一个个疑问,我们将会在接下来的讲解中,为大家一一介绍。

1. 语言

谈到语言,想必是仁者见仁,智者见智。从社会学角度来说,是人类最重要的交际工具,是人们进行沟通交流的主要表达方式。人们借助语言保存和传递人类文明的成果。语言是民族的重要特征之一。从生物学上讲,语言是指生物同类之间由于沟通需要而制定的具有统一编码解码标准的声音(图像)指令。而根据乔姆斯基的语言定义,则是认为,语言是按照一定规律构成的句子和符号串的有限或无限的集合。

既然可以计算,那么首先它得能够描述。当然这种描述肯定不能是原生态的,一定是要能计算的,也就是说使用数学方法来描述。一般的,一种语言有三种描述方式:

  1. 穷举法
      这种方法就是把语言中所有的句子都枚举出来,显然只是一种理想的模型。
  2. 文法描述
      这种方法通过严格定义的规则来构造语言中的每个合法句子,是一种生成式系统。
  3. 自动机法
      这种方法是对一个句子进行合法性检验,当然也是通过一种逻辑推理系统,
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI让世界更懂你

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值