Ubuntu20.04安装orthofinder

一、conda安装 

conda install -n orthofinder -c bioconda orthofinder=2.5.4

显示安装失败,但安装上2.53版本 

conda create -n orthofinder orthofinder=2.5.4

安装成功 #按理说一步就能安装成功,但不知道为什么中间出错了

二、下载解压缩安装

1.从github下载

https://github.com/davidemms/OrthoFinder/releases

  • 如果安装了 python 以及 numpy 和 scipy 库,下载OrthoFinder_source.tar.gz
  • 如果没有,下载更大的捆绑包OrthoFinder.tar.gz
  • 有时候网址打不开,后附安装包(除了orthofinder,还有diamond、mcl、fastme)

 链接:https://pan.baidu.com/s/1cV1nyeCKvxUwPWiLMNY5vw?pwd=ulg4 
提取码:ulg4

2.在终端中,cd到下载软件包的位置

3.提取文件

tar xzf OrthoFinder_source.tar.gz

或者

tar xzf OrthoFinder.tar.gz

 4.测试运行

python OrthoFinder_source/orthofinder.py -h

或者

./OrthoFinder/orthofinder -h

5.创建环境变量

conda create orthofinder

激活环境 

conda activate orthofinder

6.运行 

# ExampleData/ 替换为包含输入 fasta 文件的目录,每个物种一个文件

orthofinder -f ExampleData/

### OrthoFinder 工具功能及使用方法 #### 一、OrthoFinder 的主要功能 OrthoFinder 是一种用于比较基因组学研究的强大工具,其核心目标在于识别不同物种之间的正交群(orthogroups),并构建基于这些群体的系统发育树。通过该工具,研究人员可以深入了解基因家族的演化过程以及物种间的关系[^1]。 具体来说,OrthoFinder 提供以下几个方面的功能: - **鉴定直系同源基因簇**:通过对多个物种的蛋白质序列进行聚类分析,生成一组直系同源基因簇。 - **推断基因家族扩张与收缩**:利用统计模型评估哪些基因家族经历了显著的扩增或缩减事件。 - **构建系统发育树**:不仅支持物种水平上的进化关系重建,还允许针对特定基因家族建立独立的分子进化树。 此外,在实际应用过程中无需担心软件环境配置问题,因为可以通过在线平台如Galaxy生信云来运行此程序而不需要本地部署任何依赖项。 #### 二、基本操作流程概述 ##### 数据准备阶段 为了启动一次完整的计算任务,用户需准备好如下输入材料: 1. 来自各个待测生物体的所有预测蛋白编码区FASTA格式文件; 2. 可选参数设置文档; ##### 执行命令行界面(CLI)版本安装后的典型调用方式为例说明标准作业步骤: 假设当前工作目录下已经存在名为`proteins/`子目录存放有上述提到过的多套fasta形式表示的目标序列,则执行以下bash脚本即可完成初步处理环节: ```bash mkdir results && cd results orthofinder -f ../proteins/ ``` 这条指令将会自动下载必要的数据库资源(如果尚未缓存的话),接着依次经历相似度搜索、图论算法分团直至最终输出各类中间产物连带总结报告为止[^3]。 当整个运算结束后,默认会在指定根目录下面创建一个新的Results_*日期戳*命名空间保存全部成果物。其中包括但不限于以下几个重要组成部分: - `Orthogroups/*`: 存储着检测出来的所有可能组合而成的orthologous groups详情表单; - `Gene_Trees/*`: 对应于每一个单独cluster内部成员之间相互关联程度定量刻画所得phylogenetic trees集合 ; - `Species_Tree/*`: 综合考虑整体情况绘制出宏观层面反映各分类单元相对位置分布状况的大纲级otherspecies relationship diagram. 特别值得注意的是, 如果希望进一步挖掘那些仅限单一copy存在的universal marker genes以便后续开展更加精细的时间尺度校准等工作时, 则可以直接查阅位于前述提及过的位置中的专门清单文件:`Orthogroups_SingleCopyOrthologues.txt`. #### 三、高级特性探索实例分享 考虑到某些特殊场景需求可能会涉及到额外定制化选项调整的情形之下,这里给出一段示范性质较强的shell scripting片段用来展示如何提取感兴趣的single copy orthologue sequences进而打包成适合下游paml-mcmctree pipeline所需的标准化input format: ```bash #!/bin/bash # 定义变量简化路径书写复杂度 mypath=~/your_project_directory_here OrthofinderPATH=${mypath}/OrthoFinder/Results_Jun12 # 创建新工作区域切换进入其中继续操作 mkdir mcmctreeAnalysis && cd mcmctreeAnalysis # 复制必要资料过来备用 cp ${OrthofinderPATH}/Orthogroups/Orthogroups_SingleCopyOrthologues.txt . cp ${OrthofinderPATH}/Orthogroups/Orthogroups.txt . cp ${OrthofinderPATH}/Species_Tree/SpeciesTree_rooted.txt . # (此处省略若干关于解析文本内容定位对应原始faa记录的具体实现细节...) ``` 以上仅为示意框架结构设计思路仅供参考学习之目的,请根据实际情况灵活修改适应各自项目特点的要求. ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值