多序列比对

本文介绍了多序列比对的重要性和用途,并重点讲解了MAFFT软件的安装步骤(非root权限)和基本使用方法,包括下载、解压、配置、编译和安装。MAFFT是一款高效且准确的工具,适用于200条以内、长度小于2,000 bp或aa的序列文件。" 112885169,10539395,Nmap源码解析:整体架构与主程序逻辑,"['网络安全', '扫描工具', '开源软件', 'C++', '网络编程']

 

文章转载于 

多序列比对(或多序列联配,multiple sequence alignment,MSA),是指把多条(3 条或以上)有系统进化关系的蛋白质或核酸序列进行比对,尽可能地把相同的碱基或氨基酸残基排在同一列上。这样做的意义是,对齐的碱基或氨基酸残基在进化上是同源的,即来自共同祖先(common ancestor)。下图是一个 MSA 的例子。

MSA 有许多用途,如构建系统发育树,选择压分析,基因家族的保守结构域分析,motif 分析等。

MSA 分析的软件有很多,如 mafft(http://mafft.cbrc.jp/alignment/software/),muscle(http://www.drive5.com/muscle/downloads.htm),probcons(http://probcons.stanford.edu/),T-coffee(http://tcoffee.crg.cat/),clustalw(http://clustalw.ddbj.nig.ac.jp/)等。

从软件的速度和准确性出发,mafft 和 muscle 是不错的选择。这里介绍 mafft 的使用方法。

mafft 安装(非 root)

  • 下载

  • wget http://mafft.cbrc.jp/alignment/software/mafft-7.310-with-extensions-src.tgz
  • 解压
  • tar -zxvf mafft-7.310-with-extensions-src.tgz
  • 编辑 Makefile 文件的第一行
  • cd mafft-7.310-with-extensions/core/

    vim Makefile (或用 nano 等进行编辑)

    编辑:

    PREFIX = /usr/local

    为:

    PREFIX = /home/your_home/somewhere

    (如:PREFIX = /home/liuhui/bin/mafft-7.310

  • 编译和安
  • make

    make install

  • 安装最后安装在 /home/liuhui/bin/mafft-7.310/bin 下,将这个路径放到 .bashrc 中即可
  • mafft 使用方法

    mafft 的一般用法为:

  • mafft [arguments] input > output
  • input 可以是 fasta 格式的蛋白质或核苷酸序列。

    对于 200 条序列以内且序列长度小于 2,000 bp 或 aa 的文件,可以使用 mafft-linsi

  • mafft-linsi input > output
  • 文件较小时,也可以使用在线版:http://mafft.cbrc.jp/alignment/server/

 

 

 

 

 

转载于:https://www.cnblogs.com/xiaojikuaipao/p/7186286.html

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值