27、PrOntoLearn：无监督词法 - 语义本体生成方法解析

terraform7cloud

于 2025-10-07 16:48:16 发布

阅读量25

点赞数

CC 4.0 BY-SA版权

分类专栏：语义网中的不确定性推理文章标签： PrOntoLearn 无监督本体生成词法-语义本体

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/terraform7cloud/article/details/153488650

语义网中的不确定性推理专栏收录该内容

38 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

PrOntoLearn：无监督词法 - 语义本体生成方法解析

1. 预处理阶段

在对语料库进行本体生成之前，需要进行一系列的预处理操作，以消除噪声并提取有用信息。
- 过滤与正则表达式 ：系统有一个过滤参数，若用户未指定，默认正则表达式为 [a-zA-Z]+ 。例如，像 du - 145 这样的词会被该正则表达式过滤掉。
- 标记归一化 ：对标记进行一定程度的归一化，将标记规范化，以忽略标记字符序列的表面差异来实现匹配。
- 大小写折叠 ：将从语料库中学到的词汇全部转换为小写。例如， Protocol 会转换为 protocol 。
- 词干提取和词形还原 ：使用词干提取和词形还原技术，借助 WordNets 的词干提取算法，将单词的屈折形式和派生形式还原为共同的基础形式，并结合词汇的词性标注知识来获取单词的正确上下文。

2. 句法分析阶段

预处理阶段消除了语料库的噪声并根据定义对词汇进行了标注。此阶段主要关注句子的结构，学习词汇中单词之间的关联。
- POS 模式假设 ：假设语料库中的每个句子遵循 (SubjectNounPhrase+)(Verb+)(ObjectNounPhrase+) 的词性模式。
- OWL 概念形成 ：使用合适的 N

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。