基因组内和跨基因组密码子使用的可视化
1. 密码子选择分析方法
在研究密码子选择时,使用多序列比对比两两比对更具优势,因为这样能进行更有力的推断,并且可以使用更复杂的密码子模型来研究选择。具体操作步骤如下:
1. 对于给定的数据集,推断多密码子序列比对和系统发育树(最好使用密码子模型,可通过程序 codonPhyML 完成)。
2. 基于推断出的比对和系统发育关系,比较两个密码子模型:一个允许选择(在系统发育的所有或部分位点和/或分支上,ω 可以 >1),另一个不允许选择。
3. 使用统计模型比较方法,如似然比检验(LRT),推断允许选择的模型是否能更好地描述数据。
许多基于 ω 的方法隐含着同义位点和非同义位点上不存在差异选择压力这一条件(但并非严格遵守),不过也有允许可变 dN 和 dS 的模型。如果有理由认为并非所有同义位点都相同,应将其恰当地纳入建模过程。基于 ω 的方法也可应用于种内(群体)数据,但在使用时要注意对有效群体大小和突变率的初始假设,因为这些可能会影响结论。
2. 蛋白质编码序列选择压力的可视化工具
有许多软件包和在线服务可用于检测分子数据中的正选择,以下是一些最流行以及最近开发的工具:
|工具名称|特点|
| ---- | ---- |
|PAML|最早用于核苷酸和氨基酸序列最大似然系统发育分析的软件包之一,包含 CodeML 程序,可估计多种密码子模型的参数。最初只能作为命令行软件包使用,现在有正在开发的插件和包装器,便于可视化分析结果。|
|HyPhy|开源的系统发育软件包,可根据多序列比对(DNA、密码子、氨基酸)以及其他数据类型(如微卫星计数)估计的
超级会员免费看
订阅专栏 解锁全文
73

被折叠的 条评论
为什么被折叠?



