Twisst 是一个基于树文件计算一组分类群拓扑权重的软件。它可用于使用群体基因组数据探索分类群关系在整个基因组中的变化。twisst 依赖 ete3包
D:\Python39> pip install ete3
Downloading ete3-3.1.3.tar.gz (4.8 MB)
Successfully built ete3
Installing collected packages: ete3
Successfully installed ete3-3.1.3
--- pip show ete3
Summary: A Python Environment for (phylogenetic) Tree Exploration
Home-page: http://etetoolkit.org
简介
拓扑加权是量化不一定是单系群之间关系的一种方法。它通过考虑更简单的“分类单元拓扑”并量化与每个分类单元拓扑匹配的子树的比例,提供了复杂谱系的摘要。我们用来计算权重的方法称为 Twisst:通过子树的迭代采样进行拓扑权重。
在本次实践中,我们将使用模拟数据来探索拓扑权重如何提供谱系历史。然后,我们将尝试使用针对窄窗口推断的邻居连接树来推断整个模拟染色体的拓扑权重。
工作流程
我们将分析一组谱系,这些谱系代表了在相当复杂的历史(包括种群细分、基因流动和选择)下进化的染色体部分的历史。我们将使用 twist 计算该基因组区域的拓扑权重,然后在 R 中探索结果。
1. 模拟家谱分析
下载代码和数据
这部分实践的脚本和示例数据位于 github 上的 twisst 包中。
wget https://github.com/simonhmartin/twisst/archive/v0.2.tar.gz
cd D:\生物信息学
tar xzf twisst-0.2.tar.gz
我们将使用的示例数据由编码为 Newick 树的家谱文本文件组成。在本例中,树木是使用模拟器 msms 进行模拟的。如果我们有真实数据,我们将不知道这些