- 博客(2)
- 收藏
- 关注
原创 生信 数据格式转换汇总(一)
大家在使用时候只需要将gene.fastq换为自己的文件即可,这个功能其实好多工具都可以实现,大家没必要纠结,包括后续要介绍到的seqtk也可以实现。主要用到的参数就是-i、-o、-w。有时从NCBI上下载下载下来的文件并不是bam文件而是sra文件,这时候我们就需要用到SRA_Toolkit工具就将其转化为fastq文件。当然你可能并不想提取最长的几条序列,这并不影响,只需要将你需要提取的序列命令输入list直接使用第四步提取即可。上述提到的所有保存名字的文件均需以以下形式保存(一行一个!
2024-07-05 16:47:18
1965
1
原创 一文搞懂ALLHiC构建Allele.ctg.table
其中qry为自己的多倍体序列,ref_cds为同源物种的cds序列,N为你自己基因组的倍性,几倍体就填几,接下俩俩行代码需要修改的就是 -t 这是指代的是你的线程数,最后一行代码代码这里就有一个小小的坑点,这里的oleosum_genomic.gff3为你的近缘物种的gff文件,需将其修改为自己下载好的文件。这里给大家提供一个我匹配的思路,我是根据下划线的数量去匹配的。那么我们现在就拥有了需要的全部文件,这是否意味着我们可以构建自己的table表了,理论上是这样的但是,注意这里出现了最大的坑点。
2024-07-03 11:00:12
1292
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人