新冠病毒B细胞表位预测:方法与成果
1. 免疫显性表位与MHC分子
利用IEDB工具(http://tools.iedb.org/processing/),确定了HLA - A、HLA - B和HLA - C所有可用MHC等位基因的免疫显性表位。研究发现,所有免疫显性表位都能进一步被蛋白酶水解,并被MHC I类分子识别(处理得分>1)。这意味着,序列较长的免疫显性表位的核心部分,在经过蛋白酶体处理后,可由MHC I类分子呈递。
2. 支持向量机预测B细胞表位
为预测线性B细胞表位,采用了支持向量机(SVM)这一机器学习方法。SVM分类器的性能很大程度上取决于核函数的选择,但目前尚无基于数据选择优质核函数的理论基础。因此,除了广泛使用的径向基函数(RBF)核,还探索了一类核方法——字符串核。同时,引入了子序列核(SSK),它在文本分类中已取得成功,但在大分子序列分类应用中研究较少。实证结果表明,SSK的性能优于其他字符串核和RBF核。所以,在提出的线性B细胞表位预测方法BCPred中,使用SSK构建SVM分类器。
3. 数据与材料
从NCBI基因库(NC_045512和NC_004718)获取了2019 - nCoV(SARS - CoV - 2019)和SARS - CoV的参考序列数据。然后,基于参考基因组提取了2019 - nCoV的ORF1AB、S、ORF3A、E、M、ORF6、ORF7A、ORF7B、ORF8、N和ORF10的蛋白质序列,单蛋白质基因组不纳入分析。
4. 方法学
支持向量机(SVM)是用于分类和回归的有监督机器学习方法。给定一组标记的训练数据$(x_i,y_i
新冠病毒B细胞表位预测方法
超级会员免费看
订阅专栏 解锁全文
25

被折叠的 条评论
为什么被折叠?



