模糊基因过滤器:用于表达阵列特征选择的自适应模糊推理系统
1. 引言
微阵列技术实现了基因表达的高通量分析。它能量化组织 mRNA 含量,帮助识别过表达或低表达基因。微阵列由数千个绑定在芯片基板上的寡核苷酸探针集组成,可为芯片上的每个基因生成表达值。微阵列数据不仅能识别基因表达故障,还能用于开发诊断和预后分类器。
微阵列数据分析的关键在于识别区分不同类别的基因。若使用优质特征进行分类,即使简单的分类器也能达到高精度。对于微阵列数据分类,特征是那些在不同类型样本间表现出显著差异的基因表达值。这些基因的识别方法是先按差异表达对基因进行排序,再通过交叉验证确定用于分类器训练和测试的最优排名靠前的基因数量。
本文介绍了一种基于自适应模糊推理系统的微阵列基因表达特征排名新方法——模糊基因过滤器(Fuzzy Gene Filter,FGF)。FGF 结合了参数和非参数输入,并引入遗传算法(Genetic Algorithm,GA)来确定模糊隶属函数的最优参数。通过两个公开数据集对 FGF 进行测试,并将结果与经典特征排名技术以及先前使用相同数据集得到的结果进行比较,比较标准为最大类可分性和交叉验证准确性。
2. 基因排名
2.1 经典基因排名技术
- 倍数变化(Fold Change) :最原始的基因排名标准。若某个基因在一类样本中平均低表达,而在另一类样本中平均高表达,则被视为区分不同类别的基因。但该方法未考虑基因在类内的方差,因此出现了更合适的参数排名技术,如 t 检验。
- 两样本 t 检验(Two-sample t-test) </
超级会员免费看
订阅专栏 解锁全文
676

被折叠的 条评论
为什么被折叠?



