符号回归与遗传编程:从分类扩展到进化计算
1. 符号回归扩展到分类
当目标是寻找分类模型而非回归模型时,符号回归(SR)需要扩展为符号分类。这涉及到扩展模型结构和适应度函数。
- 模型结构
- 学习决策树 :最直接的方法是学习能直接计算类别的模型,通过将函数库限制为条件语句(如 if/then/else 节点)和逻辑函数(如 and、or 等)来实现。进化过程可能会形成包含条件语句、逻辑函数、变量和常量的模型,从而产生决策树。
- 学习带阈值的判别函数 :更通用和灵活的方法是让过程学习实值数学函数,然后将函数评估结果映射到类别标签。通常使用遗传编程(GP)来学习能计算与给定类别值相匹配的模型。这意味着类别标签必须表示为可作为目标值的数值,并且需要为每个模型确定最佳阈值,以便为样本估计类别。
对于一个具有有序类别标签的 n 类分类问题,如果学习到一个模型 f,则需要定义额外参数 ζ1…ζn - 1 作为阈值,以产生输入 x 的预测类别 class(x):
[
class(x) =
\begin{cases}
1 & f(x, \theta) \leq \zeta_1 \
i & f(x, \theta) > \zeta_{i - 1} \text{ 且 } f(x, \theta) \leq \zeta_i \
n & f(x, \theta) > \zeta_{n - 1}
\end{cases}
]
阈值 ζ 应根据分类误差度量(如准确性或灵
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



