ONTOMO与融合论证:本体构建与论证框架的创新探索
1. ONTOMO本体构建服务
1.1 实例提取
在本体构建中,实例提取是重要的一环。如果
| 标签仅包裹了部分种子实例,可能不会提取到标签。当提取到包裹每个种子的标签时,会利用这些标签提取其他实例。例如,若种子为某些特定名称,使用相应标签能提取出如Mazuda、Suzuki等属于同一类别的实例,并将提取的实例添加到种子列表用于后续提取。 |
不过,在网页中进行实例提取时,可能会遇到精度下降的问题。因为错误的模式可能会导致提取出意外的候选实例,这些实例可能会被选作种子用于后续提取,从而使错误实例数量激增,精度下降。为防止精度下降,会考虑网页中包裹每个种子的模式数量N,若N < 2,则丢弃该模式及其中包裹的所有候选实例。
1.2 实例推荐机制概述
将用户想要检索的集合记为Si,ONTOMO专有名词提取返回的集合记为Se。理想情况下,Si应几乎等于Se,此时只需将ONTOMO提取的所有实例输入到本体中。但如果Si不等于Se,则需要采取以下措施:
- |Se∩Si|≪|Si| :若Si中只有少量正确实例包含在Se中,召回率较低。此时需要输入一个不在Se但在Si中的新实例,得到新的扩展集合Se′,以提高召回率(实验1)。
- |Se∩Si|≪|Se| :若Se中有大量错误实例,而包含在Si中的正确实例很少,精度会下降。此时采用精度过滤器,去除错误集合Sx
超级会员免费看
订阅专栏 解锁全文
4万+

被折叠的 条评论
为什么被折叠?



