- 博客(21)
- 收藏
- 关注
原创 基因组文件同时存在大写AGCT和小写agct,统一大小写
1、将序列以大写字母的形式输出。2、将序列以小写字母的形式输出。图中圈起来的是两者的区别。
2024-09-11 11:03:00
1014
原创 gz压缩文件,你应该知道的那些是事
不是所有的压缩文件都可以用gzip ,pigz进行压缩的,比如在对 vcf 文件压缩时,不可以用 gzip 来代替 bgzip,否则后续利用tabix 建索引 可能会出现错误。
2024-09-10 11:43:27
1319
原创 处理软连接的命令
压缩带软连接目录文件 tar -chzvf file.tar.gz file (其中-h为保证软链接正常压缩的参数。如果目录里无软链接,便不要添加,否则压缩文件可能会出问题, 无软链压缩命令 tar -czvf file.tar.gz file。上传带有软连的目录到桶里的命令 obsutil cp -r -f req_out/ obs://omt-hwy/01.Project/01.reseq --link 其中 -r -f 表示上传目录递归,-link 为软连接。
2024-08-13 10:29:40
251
原创 可以直接cat 多个fq.gz压缩文件
1.fastq.gz和2.fastq.gz 大小71M , 67 M 直接cat 为137 M ,zcat 可能差距较大。
2024-05-24 14:42:23
1006
1
原创 SNP----index(先减在平均)
如下图所示,参考基因组上是C碱基,G是突变碱基,覆盖左边的C的reads有10条,其中有4条reads该位点是G,那么SNP-index为0.4;分析模块,根据设定的窗口大小(SNP number)和步长(SNP number),对窗口进行滑动,计算区间内所有变异位点的SNP-Index均值。混池1在这个区间内所有变异位点SNP-Index计算结果的平均值(混池名称与输入的VCF文件中的名称一致)。混池2在这个区间内所有变异位点SNP-Index计算结果的平均值(混池名称与输入的VCF文件中的名称一致)。
2024-05-07 14:59:23
1558
原创 seqkit 那些事
参数指定要截取的范围,这里是从141到15380。执行该命令后,将会生成一个包含指定范围的子序列的输出文件。表示截取从第141个碱基到第15380个碱基的子序列。上述命令中的范围索引是以1为基准的。改为碱基全部大写的形式,改为碱基全部大写的形式。请注意,使用之前要对。
2024-03-14 18:03:30
1604
原创 Linux之snodes 查看节点使用情况详解
snodes 查看节点负载 # 输出解释:含义: 各列的具体含义解释Queue: 节点所在队列名称VirtualFree: 可用虚拟内存大小FreeCPU: 可用 CPU 数量NJOB: 在节点上运行的作业数目%LOAD: 节点负载百分比SWAP: 交换空间使用情况States: 节点状态信息。
2024-03-14 17:17:35
2125
原创 维恩图:你真的了解么?
维恩图一般可画在2到7组之间。因此便需要调整比较组个数维恩图用于展示在不同的事物群组(集合)之间的数学或逻辑联系,尤其适合用来表示集合 (或)类之间的“大致关系”,它也常常被用来帮助推导(或理解推导过程)关于集合运算(或类运算)的一些规律。可以画多个分组。
2024-01-24 10:17:36
1911
1
原创 fastp软件 :rawdata生成cleandata
I 大写 i 后接read1.fq.gz。-o 后接输出的clean.1.fq.gz。-O 后接输出的clean.2.fq.gz。--html 生成的html文件。-i 后接read1.fq.gz。--json 生成的json文件。
2024-01-23 17:17:46
1360
1
原创 NCBI下载整个界面和只下载序列的方法
根据要下载的内容,搜索对应的名称(拉丁名)或者编号(比如 NC_018119.1),然后就可以进入到下面的界面,就根据图片的提示下载对应的文件即可。
2024-01-23 14:59:27
1532
1
原创 linux 命令
命令是用于在 Linux 和 macOS 系统上创建 ZIP 格式的压缩文件。如果你在 Windows 系统上使用,可以使用类似的命令,但命令参数可能会稍有不同。压缩文件中的所有文件和目录的详细信息,包括文件名、大小、压缩比等。在打包时跟随软链接,将链接指向的文件也包含在压缩文件中。参数表示递归地将目录及其内容包含在压缩文件中。要打包压缩含有软链接的文件或目录,可以使用。要查看压缩后的文件内容,可以使用。替换为你要打包的实际目录路径,参数表示创建新的压缩文件,参数显示详细的打包过程,
2024-01-23 11:48:12
1060
1
原创 HMMER 隐马尔可夫模型序列最新下载方法
注意:这是一个二进制文件,和之前pfam数据库的文件有差别。下载的文件加后缀.gz,然后解压这个文件,gunzip。interpro网页说明。
2024-01-09 16:08:57
1756
1
原创 截图工具分享
Ploacode的使用主要是在VS Code平台上,需要安装该插件。直接通过VS Code左侧扩展栏查找并进行安装即可,当然这个我也没用用过,大家可以试一下。我常用的软件:snipaste 这个软件免费,好用!
2024-01-09 16:07:16
430
1
原创 关于Minia软件的使用,二代数据,三代数据等组装
kmer-size参数:该参数用于指定kmer大小,即在组装过程中使用的短序列片段的长度。一般来说,常用的kmer大小范围在15-31之间,具体取决于你的数据集和实验目的。-nb-cores参数:该参数用于指定使用的CPU核心数,即同时运行的线程数。除了这两个参数,Minia还有其他一些重要的参数,例如输入文件路径(-in)、输出文件前缀(-out)、内存限制(-mem)等。Minia软件有许多参数和选项可以用于调整组装过程,其中两个常用的参数是-kmer-size和-nb-cores。
2024-01-09 16:02:10
952
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅