基于二肽和长度特征的细胞因子预测及无监督人脸识别新方法
在生物信息学和图像处理领域,细胞因子预测和人脸识别都是备受关注的研究方向。本文将介绍一种基于二肽和长度特征的细胞因子预测方法,以及一种无监督的人脸识别新方法。
细胞因子预测方法
细胞因子是细胞间重要的调节因子,在多种疾病过程中发挥着关键的生理作用。在基因组测序技术不断发展的今天,可用的序列数据量与对其功能的实验表征之间存在着越来越大的差距。因此,开发从原始序列中识别新细胞因子的自动化方法是后基因组时代生物信息学的一项关键任务。
数据集
本研究使用的数据集最初来自 http://cytokine.medic.kumamoto - u.ac.jp/,包含 1173 种细胞因子,分为八个主要类别:趋化因子、FGF/HBGF、IL - 6、LIF/OSM、MDK/PTN、NGF、TGF - Beta 和 TNF。经过排除高度同源序列后,最终得到 437 条非冗余序列,包括除趋化因子外的七个类别。为避免某些类别序列数量不足,将 IL - 6、LIF/OSM、MDK/PTN 和 NGF 合并为一个类别。
支持向量机(SVM)
支持向量机是一种基于结构风险最小化的机器学习方法。它在高维空间中构建一个超平面,将正例和反例分开,这个高维空间称为特征空间。SVM 通过核函数将原始数据映射到更高维度的特征空间,并在其中找到一个最优的分隔超平面。本研究使用免费软件包 LibSVM 实现 SVM,可从 http://www.csie.ntu.edu.tw/~cjlin/libsvm/ 下载用于学术研究。
多类分类
SVM 基于两类分类,但细
超级会员免费看
订阅专栏 解锁全文
5317

被折叠的 条评论
为什么被折叠?



