同源基因鉴定 | OrthoFinder 2.0 + MAFFT + IQtree

写在前面

写这个贴子纯粹为了记录一下自己的双面打工人的生活,然后再总结一下自己的工作方法还有哪些地方存在问题,希望下次再遇到这些小问题的时候可以更快速地应对。

同源关系如何定义| How to define ortholog?

可以参考这篇文章中的记录:https://www.jianshu.com/p/82d4cf6c3eda

简单来说,就是speciation events得到的是一对或者一组基因,称为orthologs,而gene duplication事件形成的一对或者一组基因,称为paralogs。

而在实际的分析中,往往得到的是一组orthogroup(比如OrthoFinder 2.0的结果文件),其中不仅包含了ortholog还包含了paralog。

流程实现

注意

分析过程中需要注意的问题,

  • 从蛋白质序列的相似度、系统发育的角度,一个species内的paralog一般比两个species之间的ortholog要呈现出更高的相似度

    举个例子,比如水稻和拟南芥的某一个disease-resistant gene,Arab genome内部的paralog之间的序列相似度,相较于rice和Arab之间的相似度,前者的相似度更高,反映在最终的phylogeny上,也是Arab的paralog之间会更倾向于聚集在一个clade上,而不是单独与rice genome中的ortholog聚集在一个clade上

  • 先鉴定出一个species内部,一个gene的orthogroup,可能能够增加鉴定到另一个species中ortholog的概率

思路

分析的一个流程如下,

  • OrthoFinder 2.0
  • seqkit提取targeted gene
  • reciprocal BLAST
  • JCVI提取每个query的最优比对结果
  • MAFFT
  • IQtree 2.0
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值