使用transanno制作不同基因组版本坐标映射的chain 文件?

不同基因组版本的位置(坐标)对应关系,在数据分析环节经常用到。

位置对应关系通常通过比对来获取,而信息一般存储在chain文件中

对于人类、小鼠等模式生物而言,UCSC已经提供了不同版本的chain文件

对于非模式生物,往往需要先自己制作chian文件,再通过ncbi的remap,UCSC的lifeover和crossmap等工具进行坐标转换。

UCSC官网也提供了制作chain文件的方法。但需要parasol集群环境(需要root)。这一步的设置往往难倒了不少人,尤其是ssh localhost。

最近找了一个新工具transanno,结合minimap2比对,30分钟内就能创建一个新的chain文件,使用起来也非常简单。感谢开源,感谢李恒。

# minimap2比对
minimap2 -cx asm5 --cs QUERY_FASTA.fa REFERENCE_FASTA.fa > PAF_FILE.paf

# transanno创建chain文件
transanno minimap2chain PAF_FILE.paf --output CHAINFILE.chain

后续选择相应工具即可进行坐标转换,也可以继续用transanno,转换vcf、bed、gff/gtf(仅限genecode/Ensembl格式)等格式文件。

操作失败的教程: https://www.dazhuanlan.com/hokit/topics/1370056 https://www.jianshu.com/p/825993c9b03a

本文由 mdnice 多平台发布

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值