- 博客(12)
- 收藏
- 关注
原创 Aviary分箱cluster参数速查表
摘要:该工具用于对宏基因组组装基因组(MAGs)进行聚类和去冗余处理。主要参数包括输入目录(必填)、输出目录(默认当前目录)、ANI阈值(去冗余97%,预聚类95%)、质量过滤指标(完整度、污染度)、计算资源设置(线程8-16,内存250GB)等。支持多种预处理方法(dashing/finch)和数据库(GTDB等),可配置集群运行参数。工具基于Snakemake工作流实现,默认执行complete_cluster流程,提供环境构建、空跑检查等功能。
2025-09-06 12:08:01
171
原创 Aviary分箱recover模块速查表
该速查表整理了recover模块的主要命令参数,分为输入序列、质控过滤、组装策略、分箱参数等功能类别。包含输入文件类型、质控阈值、组装方法选择、分箱参数设置等关键选项,并标注了默认值和可选范围。特别针对长读过滤、比对覆盖度、分箱工具选择等核心参数进行了详细说明,同时提供了跳过特定步骤的开关选项。此表可作为recover模块的快速参考指南,帮助用户高效配置分析流程。
2025-08-28 19:12:40
256
原创 Aviary分箱【1】
Aviary是一款集成多种工具的宏基因组分箱软件,主要功能包括基因组组装、分箱和后处理。其recover功能支持混合组装,可处理长短读段数据,提供丰富的参数选项:输入数据类型(-1/-2/i/l等)、组装选项(如k-mer设置)、质量控制、contig过滤策略、分箱工具选择(默认含Rosella/MetaBAT等),以及后处理评估(如CheckM2/GTDB)。用户可灵活配置计算资源(CPU/内存/GPU)和工作流控制(dry-run/清理中间文件等)。安装可通过GitHub获取,支持数据库下载功能。
2025-08-27 17:09:52
500
原创 【病毒组tips】解决DeepVirFinder卡死/长时间长_2
在使用DeepvirFinder过程中,租赁的不同服务器上可能由于缓存空间/结构设计的不合理(主要还是设计的比较小)可能导致Deepvirfinder在/dev/shm中生成的执行文件累积过多,导致任务卡死。这就需要设计一个小的shell脚本每隔一段时间删除那些没有用的文件(当然,其他很多方式都可以达到目的,自己只会shell没办法)。另存为成一个sh文件,直接把他托管给screen就好了,这样的话就会每隔50分钟删除一下/dev/shm执行文件。
2025-01-08 10:33:47
343
原创 【病毒组tips】在服务器上下载IMG/VR数据库
PS:服务器似乎不支持断点再续,和多线程下载,若网络问题重新下载需要删除源文件,建议白天下载,晚上下载速度较慢。4.可以对比一下MD5信息。
2025-01-08 10:29:08
1027
原创 【病毒组tips】解决DeepVirFinder卡死/运行时间长_1
解决在使用DeepVirFinder过程中所有进程cpu占用都是0但是进程仍然存在,也没有结果继续输出:主要原因是拼接后的序列过长(超过2 M)剩下事情就是将过滤出来比较大的contig拆成两个部分去跑,切记每个contig的长度要小于2M。
2025-01-08 10:27:56
315
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅