21、自然语言处理中的本体构建与文本分类技术

自然语言处理中的本体构建与文本分类技术

自然语言与知识表示语言

自然语言并不适合作为知识表示语言。尽管构建本体时必须依赖自然语言(通常是构建者的母语),但有必要将其形式化,即将自然语言的概念转换为形式化符号,并在两者之间建立映射关系。

俄罗斯学者图佐夫(Tuzov V.A.)设计的语义元语言是物理符号和俄语词汇的组合。它具有以下特点:
1. 是一种与自然语言等价的抽象语言,语义完全形式化,只有计算机能够使用这种语言进行交流,与任何自然语言没有直接联系。
2. 是一种形式化的计算机语言,文本意义可以表示为计算机能够理解的形式。

鲁巴什金(Rubashkin)和拉胡蒂(Lahuti)建立了一个概念词典,采用逻辑语言作为形式表示语言。他们认为只有逻辑语言才能全面、有序且形式化地描述词语之间的意义关系,但这种观点过于绝对。逻辑语言并非唯一适合语义表达的形式语言,自然语言文本中的一些元素无法在逻辑表达式中存在,或者没有等价的单元,但这些元素对于正确建立句子的语义表达是必要的。

马尔蒂诺夫(Martynov)自20世纪70年代以来一直致力于面向计算机的通用语义代码(УCК)的研究,并在2001年提出了УCК - 6。УCК - 6使用X、Y、Z、W作为原始/概念原语,X是主体,Y是工具,Z是对象,W是结果。例如,((XY)Z) ((ZW)Y) 表示X通过Y作用于Z,创造出W,即X创造了W,实际上它是 ((X ! Y) ! Z) ! ((Z ! W) ! Y) 的缩写。

语言本体的构建方法

许多研究人员根据实践经验总结了构建语言本体的方法。鲁巴什金和拉胡蒂指出,构建概念词典需要解决以下基本理论和方法问题:

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值