11、分类法间概率映射的发现与分析

分类法间概率映射的发现与分析

1. 噪声对分类器精度和召回率的影响

在研究分类器结果和映射概率值时,发现当噪声为 0% 时,存在一些无效映射被错误地赋予了过高的概率,从而被视为有效映射,这解释了精度值未达到完美的 0.88 的原因。这些映射的概率值接近阈值。当增加噪声时,分类器变得更加严格,所有概率值都有下降趋势。对于一定程度的噪声,无效映射的概率会降至阈值以下,而有效映射的概率仍保持在阈值以上,从而提高了精度。

2. 真实世界 OAEI 数据实验
  • 实验数据 :对 OAEI 竞赛的目录集进行实验,该集合由两个分别包含 2857 和 6628 个类别的大型分类法组成。如果不进行剪枝,搜索空间将达到 3000 万个映射。
  • 实例填充 :为了弥补这些分类法中可用实例的不足,采用受相关方法启发的方式,自动用 WordNet 同义词集填充类。原理是将每个类 C 与一组能反映其在所属分类法中上下文含义的同义词集关联起来,帮助消除词义歧义。例如,“Arizona” 可能指美国的一个州或一种蛇,如果它是 “Animals” 类的子类,就可推测其指蛇的物种。
  • 实验结果 :在两个完整的分类法上,填充阶段产生约 30000 个实例,耗时 5 小时,而映射发现算法仅需 11 分钟。基于 OAEI 提供的部分参考,在阈值 Su 和 Sc 分别设为 0.9 和 0.8 时,得到的精度下限为 67%。
3. 网络目录的比较分析
  • 实验数据

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值