微阵列癌症分类中的基因选择与得分空间比较
在生物医学和机器学习的交叉领域,微阵列数据的分析对于癌症分类至关重要。本文将介绍两种重要的方法:一种是用于微阵列癌症分类的新基因选择方法,另一种是对表达微阵列数据分类的不同生成得分的实证评估。
新基因选择方法(DAFS)
在评估 DAFS(一种特征选择算法)时,会考虑多种多样性度量来计算 DA 度量。多样性在分类器集成中没有普遍接受的正式定义,本文采用了 Q - 统计量(Q - sta)、相关系数(Corr)、分歧度量(Dis)和双错误度量(DF)这几种多样性度量,具体公式如下:
- (Q - sta_{l_a,l_b} = \frac{N_{11}N_{00} - N_{01}N_{10}}{N_{11}N_{00} + N_{01}N_{10}})
- (Corr_{l_a,l_b} = \frac{N_{11}N_{00} - N_{01}N_{10}}{\sqrt{(N_{11} + N_{10})(N_{01} + N_{00})(N_{11} + N_{01})(N_{10} + N_{00})}})
- (Dis_{l_a,l_b} = \frac{N_{01} + N_{10}}{N_{11} + N_{10} + N_{01} + N_{00}})
- (DF_{l_a,l_b} = \frac{N_{00}}{N_{11} + N_{10} + N_{01} + N_{00}})
其中,(l_a) 和 (l_b) 表示被比较的两个分类器,(N_{11}) 和 (N_{00}) 分别是两个分类器同时做出正确和错误决策的样本数量,(N_{10}) 和 (N_{01}) 是两个分类器标
超级会员免费看
订阅专栏 解锁全文
16

被折叠的 条评论
为什么被折叠?



