基于包装器和集成的特征子集选择方法在生物标志物发现中的应用
在生物医学研究中,准确区分代谢上非常相似的受试者群体是一项具有挑战性的任务。尤其是对于非酒精性脂肪性肝病(NAFLD)患者,区分胰岛素敏感和胰岛素抵抗的个体,对于预测2型糖尿病(T2D)的发病风险至关重要。本文将介绍如何应用多种搜索启发式方法结合不同的分类器,从靶向代谢组学数据中识别能够准确分类血浆样本的化合物子集。
背景与现状
- 背景 :NAFLD与胰岛素抵抗相关,但也可在胰岛素敏感的受试者中检测到。胰岛素抵抗的NAFLD患者早期患T2D的风险很高,需要及时进行预防性干预和药物治疗;而胰岛素敏感的NAFLD患者患T2D的风险较低。因此,发现能够区分良性和恶性脂肪肝的新型代谢物生物标志物具有重要意义。
- 现状 :代谢组学作为一门新兴学科,通过测量细胞、组织或体液中的小分子代谢物,揭示生理过程的信息。现代高通量技术产生了大量数据,需要进行降维处理。特征选择方法可以分为过滤法和包装器法。过滤法计算特征相关性得分,丢弃得分低的特征;包装器法通过搜索过程生成和评估特征子集,并使用分类算法进行评估。
方法
- 血浆样本 :选取40名患有NAFLD的成年人(20名胰岛素敏感和20名胰岛素抵抗)的血浆样本,在进行九个月的生活方式干预(包括饮食咨询和增加体育活动)前后采集样本。
- 数据采集 :使用Biocrates的靶向IDQ平台测量EDTA血浆中247种化合物的浓度。只考虑可靠测量(
超级会员免费看
订阅专栏 解锁全文
52

被折叠的 条评论
为什么被折叠?



