用最多k个合取式的析合范式表达假设空间,估算可能的假设总数:
假设观察到的属性取值没有穷尽所有可能的取值。属性以西瓜的颜色为例,在训练集(page 4,表1.1)中,该属性取值有“青绿”,“乌黑”两个,在未知数据(page 5)中,该属性可能取值为“浅白”。故而,(色泽=青绿)∨(色泽=乌黑)和(色泽=*)是两个不同的假设。
假设析取范式内部,属性只能取一个值。意即,不允许出现((色泽=青绿、乌黑)∧(根蒂=蜷缩))这样的析取范式。
为了处理冗余的情况,我们定义析取范式的包含关系:
\[