63、替代聚类的特征选择与通用空间天际线算子研究

替代聚类的特征选择与通用空间天际线算子研究

替代聚类的特征选择

在数据聚类领域,寻找替代聚类是一个重要的研究方向。传统的矩阵求逆方法在特征选择时存在一些问题,它会对原聚类中不重要的特征赋予比重要特征更大的权重,这相当于反转了特征选择,并不总是能取得良好的效果。

我们提出了一种基于数据变换的方法,其过程如下:
1. 特征选择 :选择一组数据特征的组合,使得在变换后的数据中不太可能找到原聚类。具体来说,选择对进一步划分每个数据簇重要的特征。
2. 数据变换 :根据所选特征对数据进行变换,通过对特征加权,使这些特征比原聚类中的原始特征更重要。
3. 寻找聚类 :在新数据上应用聚类算法,其目标函数使用与质量度量相同的标准,以获得最佳的聚类质量。

重要特征的定义与选择

重要特征是数据变换方法的基本概念。在研究中,如果一组特征对聚类的形成贡献最大,则称其为重要特征。聚类的形成可以用聚类质心之间的距离来表示。例如,在某个聚类中,特征y对聚类形成的贡献比特征x大,那么y就是该聚类形成的重要特征。

当特征数量非常大时,我们会选择一组总贡献超过一定阈值的特征。特征按照重要性降序选择,当达到阈值时停止选择。在实验中,阈值设置为0.9,以选择大部分重要特征。具体的选择算法如下:

Algorithm 1. Important Feature Selection
total importance ←0
total distance ←Σ
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值