- 博客(3)
- 收藏
- 关注
原创 处理数据不平衡的论文的核心思路idea总结
比较有趣的是,本文中提出了一种比较新颖的所谓利用粗糙集中的下近似关系来进行数据清洗,这个数据清洗的目的就是将smote中生成的质量不高的新样本删除掉。为0时,离散情况为两个月样本类别不同,连续情况为二者是某特征K下差别or距离最大的两个点。即两者之间没有任何关系。即xi与xj在各个维度或者各个特征下都一模一样,即完全相似,所以相似度为1。用以上公式定义相似度,设定一个阈值,相似度高于阈值则认为属于下近似集,即进入了正域。即特征K与分类无关,是个无用特征。相似度公式分析(取极限情况,看看定义的目的在哪)
2023-05-04 23:04:05
238
1
原创 IFROWANN 文献解读
不平衡模糊粗糙有序加权最近邻分类,基于粗糙集理论中的上下近似,定义了自己的模糊粗糙上下近似,但在FRNN分类器中,对多数类和少数类并没有做不同处理。因此,在本文中,引入了owa有序加权算子来对不平衡数据进行调节
2023-03-14 17:24:03
111
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人