决策规则集成在线学习算法与自动图像标注
1. 决策规则的应用与初始分类器构建
1.1 决策规则适用性判断
若决策规则(1)满足 (b_i(1) = a_i(1), \cdots, b_i(m) = a_i(m)),则称该规则适用于对象 (O)。找到 (S_{\alpha}(T_c)) 中所有适用于对象 (O) 的决策规则,将这些规则右侧的元组逐元素相加,记得到的元组为 ((P_1, \cdots, P_k)),对象 (O) 的预测决策为该元组中最大元素的索引(若多个元素达到最大值,则取第一个)。若 (S_{\alpha}(T_c)) 中没有规则适用于对象 (O),则取表 (T_c) 中最常见的决策作为对象 (O) 的决策。
1.2 规则剪枝操作
- 为 (S_{\alpha}(T_c)) 中的每个规则 (rule(T_c, r)) 分配一组实数 (A(T_c, r))。对于 (j = 1, \cdots, m),考虑规则 (f_i(1) = a_i(1) \land \cdots \land f_i(j) = a_i(j) \to (p_1, \cdots, p_k))。
- 记 (\beta_j = 1 - |U(T_c, r, j)|/|U(T_c, r)|),其中 (|U(T_c, r, j)|) 是 (U(T_c, r)) 中被属性 (f_i(1), \cdots, f_i(j)) 与行 (r) 分隔开的行数。则 (A(T_c, r) = {\beta_1, \cdots, \beta_m}),(A = \cup A(T_c, r))(并集取遍表 (T_c) 的所有行 (r))。
- 对于每个