研究物种的系统进化关系的一些方法

探讨了多种生物序列分析方法,包括基因序列比较、蛋白质序列聚类、病毒分类等,利用不同维度向量和距离矩阵进行UPGMA建树,并与Clustal算法进行比较。涉及自然向量法、蛋白质映射、K字符串字典及Yau-Hausdorff距离等技术。

1.《A novel fast vector method for genetic sequence comparison》:
(1)考虑嘌呤,嘧啶,酮,每两个为一个字母,共23=6个字母;
(2)每个字母有个数,位置,二阶距,形成18维向量;
(3)距离矩阵(欧式距离);
(4)UPGMA建树;
(5)和Clustal比较
Supplementary information accompanies this paper at https://doi.org/10.1038/s41598-017-12493-2.
(包含所用的数据)
2.《A novel alignment-free vector method to cluster protein sequences》:
(1)蛋白质的三个性质the hydropathy index(正负性3个阿拉伯字 母) , the polar requirement(3个阿拉伯字母) and the chemical composition of the side chain(2个阿拉伯字母),共8个;
(2)每个字母有个数,位置,二阶距,形成24维向量;
(3)距离矩阵(欧式距离);
(4)UPGMA建树;
(5)和Clustal比较
Supplementary material associated with this article can be found, in the online version, at : 10.1016/j.jtbi.2017.06.002.
3.《Convex hull analysis of evolutionary and phylogenetic relationships between biological groups》:
(1)经典的12维向量(A C G T);
(下面的目前还没看明白,但是很有趣,好像用了拓扑的知识)
4.《An information-based network approach for protein classification》:
**有一些句子:
(1)Some representatives of these methods are the natural vector method [10, 13, 14], protein map [8,9], K-string dictionary [11], and Yau-Hausdorff distance
(下面的目前还没看明白)
5.《A coevolution analysis for identifying protein- protein interactions by Fourier transform》:(yin changchun;yua,2016)
6.《Virus classification in 60-dimensional protein space》:
(1)每个氨基酸(20个)有3个分量:个数,平均位置,二阶距。共20
3=60维向量;
(2)Hausdorff距离,得距离矩阵

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值