8、自顶向下数据驱动策略向归纳逻辑编程的扩展

TDD策略扩展至ILP的研究

最新推荐文章于 2025-09-10 11:28:25 发布

a1b2c

最新推荐文章于 2025-09-10 11:28:25 发布

阅读量8

点赞数

CC 4.0 BY-SA版权

分类专栏：逻辑与学习的交汇文章标签： TDD策略归纳逻辑编程最近错过示例

本文链接：https://blog.youkuaiyun.com/a1b2c/article/details/153953118

逻辑与学习的交汇专栏收录该内容

56 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

自顶向下数据驱动策略向归纳逻辑编程的扩展

1. 最近错过示例的定义与特性

在学习过程中，为了有效处理负例，我们引入了“最近错过（nearest - miss）”的概念。设 (s \in L_h) 为种子示例，(x, y \in L_s)，距离 (d(s, y)) 为 (s) 和 (y) 之间不同属性值的数量。若 (x) 满足 ((x \leq_h y) \vee (y \not\leq_h x \wedge d(s, x) \leq d(s, y)))，则称 (x) 比 (y) 更近错过。这是 (L_s) 元素上的一个全预序，关于这个全预序的最小元素（最具体的元素）就是最近错过示例。

例如，当只有一个数值属性 (a)，种子示例 (a = 1)，两个负例分别为 (a = 2) 和 (a = 3)，将其重新表述为 (a \in [1, 2]) 和 (a \in [1, 3]) 时，尽管两个负例与种子示例的距离都为 1，但 (a \in [1, 2]) 比 (a \in [1, 3]) 更近错过，因为它更具体，拒绝它就能拒绝另一个负例。

在搜索操作中，不同策略的分支因子有所不同。无种子偏差时，自顶向下生成 - 测试操作符的最大分支因子为 4；仅考虑覆盖种子示例的特化时，分支因子为 2；而 TDD 操作符的分支因子为 1，因为 (e^{-}_2) 与 (s) 的最小泛化（lgg）实际上是一个 Winston 近错过。即使在最坏情况下（仅提供与种子示例差异最大的远错过负例），TDD 操作符的分支因子也不会超过有种子偏差的自顶向下生成 - 测试操作符。