Extract User Defined Region From An Chromosome Fasta File
小麦基因组一条染色体序列至少有500M,我们想要获得染色体某一段的序列还是比较难办的。除了samtool可以做到,今天发现一个用python写的脚本pyfaidx,使用起来也比较方便。
首先安装
pip install --user pyfaidx #安装在自己账户的 $HOME/.local/bin/faidx
sudo pip install pyfaidx #需要权限,安装在/usr/local/bin/faidx
输入命令 faidx 默认返回使用帮助
faidx
$ faidx
usage: faidx [-h] [-b BED] [-o OUT]
[-i {bed,chromsizes,nucleotide,transposed}] [-c] [-r]
[-a SIZE_RANGE] [-n | -f] [-x] [-l] [-s DEFAULT_SEQ]
[-d DELIMITER] [-g REGEX | -v] [-m | -M] [--no-rebuild]
[--version]
fasta [regions [regions ...]]
Fetch sequences from FASTA. If no regions are specified, all entries in the
input file are returned. Input FASTA file<