《数学之美》第2章自然语言处理从规则到统计

本文回顾了自然语言处理(NLP)发展的两个关键阶段。第一阶段为20世纪50年代至70年代,科学家试图用电脑模拟人脑处理语言的方式;第二阶段始于20世纪70年代末,转向基于数学模型和统计方法处理语义,解决词的多义性和上下文理解等问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1 机器智能

    自然语言处理60多年的发展过程,基本上可以分为两个阶段。早期的20多年,从20世纪50年代到70年代,是科学家走弯路的阶段。局限:用电脑模拟人脑。直到20世纪70年代,找到了基于数学模型和统计的方法。

    基于文法分析器是处理不了复杂的语句的。首先,要想通过文法规则覆盖哪怕20%的真实语句,文法规则的数量也至少是几万条。其次,即使能够写出涵盖所有自然语言现象的语法规则集合,也很难用计算机来解析。

2 从规则到统计

    语义的处理遇到了更大的麻烦。自然语言中词的多义性很难用规则来描述,而是依赖上下文,甚至是世界知识。

    转变:弗里德里克.贾里克尼和他领导的IBM华生实验室

    自然语言规则和统计之争持续了15年,原因:首先,一种新的研究方法的成熟需要很多年。其次,用基于统计的方法代替传统的方法,需要等原有一批语言学家退休。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值