9、自然语言形式化:电子词典、语法与机器的探索

自然语言形式化:电子词典、语法与机器的探索

电子词典的构建与应用

电子词典在自然语言处理中扮演着关键角色。要对一种语言的词汇进行形式化,需要构建能体现词汇形态、句法和语义属性的电子词典。例如,在分析某些词汇的使用情况时,像“abriter”不同用法的识别,有的用法因需要介词补足语或存在语法结构问题而被排除。

为了能让搜索引擎等应用使用,词典需实现词汇与语义的双单义对应,即能区分词汇的各种含义,且能自动提取明确信息。上世纪90年代针对法语的实验证明,构建这样的词典是可行的,不过估计需要五名语言学家花费五年时间完成项目。

以下是一些可用于实验的练习:
1. 在词典中查看名词“appogiatura”“banjo”“castrate”“diaphone”和“electro - pop”的定义,判断能否自动提取这些音乐术语并排除非音乐术语。
2. 查看动词“to alienate someone”“to bother someone”“to confuse someone”“to discourage someone”和“to enrage someone”的定义,确定能否自动提取这些及语义相似的动词(表达对人产生心理影响的动词)。
3. 识别并描述句子“This Attorney General threw out the results of the electoral vote”中潜在的十五个原子语言单位(ALU)。

互联网上有许多非专业的编辑词典可供使用,如下表所示:
| 词典名称 | 网址 |
| ---- | ---- |
| 美国传统词典 | www.ahdictionary.com |

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值