功能聚类、功能主点与遗传规则选择中的候选规则预筛选
1. 功能聚类与功能主点
在功能数据分析中,k - 均值功能聚类与对函数的正交基变换系数进行聚类具有“等价性”。对于高斯随机函数的 k 个功能主点和遵循随机函数的非随机功能数据的最优聚类的 k 个中心函数之间存在着紧密的关系。
具体来说,对于 k 个聚类,最优聚类的 k 个中心函数可以被视为 ξ 的 k 个功能主点的良好近似。这意味着,对于根据未知随机函数观测到的功能数据,对这些功能数据进行 k - 均值功能聚类可以估计未知随机函数的功能主点。不过,目前关于功能聚类和功能主点的理论研究还需要更深入、更详细的探索。
2. 遗传规则选择中的候选规则预筛选
2.1 引言
遗传规则选择是一种设计高精度、高可解释性分类器的方法。它从大量候选规则中寻找少量简单的分类规则。其有效性在很大程度上取决于候选规则的选择。如果候选规则过多,高效搜索其优质子集会变得非常困难;而候选规则过少,规则选择就失去了意义。
关联规则挖掘是一种常见的数据挖掘技术,其基本形式是提取所有满足最小支持度和置信度的关联规则。将其应用于分类问题通常被称为分类规则挖掘,包括规则发现和规则选择两个阶段。在规则发现阶段,使用关联规则挖掘技术从数值数据中提取大量分类规则;在规则选择阶段,使用启发式规则排序标准选择部分规则来设计分类器。本文采用遗传算法进行规则选择。
除了支持度和置信度,还有其他评估关联规则的指标,如增益、方差、卡方值等。研究表明,根据这些指标选出的最佳规则都是关于支持度和置信度的帕累托最优规则。本文探讨了将帕累托最优和近似帕累托最优规则作为遗传规则选择中的候选规则,并对 ε -
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



