- 博客(144)
- 收藏
- 关注
原创 antismash:BGC查找;bigscape2处理结果
本文介绍了antiSMASH(抗生素及次级代谢产物分析工具)的安装与使用方法。通过Mamba安装8.0.4版本,配置数据库后,使用命令行对FASTA格式文件进行批量分析。关键步骤包括:激活环境、下载数据库、准备数据,以及通过循环脚本对多个基因组文件进行分析(使用Prodigal基因预测,设置90个CPU核心)。相关资源链接包括antiSMASH官网和NAR期刊文献。该流程适用于细菌次级代谢产物基因簇的自动化检测与分析。
2025-11-27 22:39:45
243
原创 smetana 基于基因组代谢模型的 菌株互作计算
摘要:本文介绍微生物群落互作分析工具SMETANA的安装与使用流程。通过Mamba环境管理工具创建并激活专用环境后,从Bioconda渠道安装该软件。使用时可选择两种分析模式:详细模式(--detailed)输出特定互作结果至TSV文件,全局模式(--global)生成群落整体互作分析报告。输入文件需为XML格式,适用于微生物群落的功能代谢网络分析。
2025-11-23 22:37:48
71
原创 Cytoscape:共现网络可视化
本文介绍了使用Cytoscape软件进行网络可视化的基本步骤。主要包括:导入网络文件后,调整字体大小至期刊常用规格;将连线按正负相关关系设置为不同颜色;用不同颜色标注不同类别的菌株(如不同门类);添加便于操作的标签(支持String或数值型);通过鼠标拖动调整节点位置。文章假设读者已掌握软件安装方法,重点说明了美化网络图的关键操作技巧,适合科研人员快速掌握基础的网络可视化方法。
2025-11-23 17:17:31
97
原创 clusterProfile包用于宏基因组学富集分析
摘要:该流程展示了宏基因组数据的分析步骤,包括:1)使用Prodigal预测基因并CD-HIT去冗余;2)通过bwa-mem2比对和samtools处理获取基因表达量(TPM);3)利用eggNOG-mapper进行功能注释;4)在R中使用clusterProfiler进行KEGG富集分析。分析流程包含自定义Python脚本处理TPM计算和注释结果整合,最终通过差异分析和可视化比较健康与腹泻样本的功能特征。关键步骤涉及基因预测、去冗余、表达量计算、功能注释和富集分析,适用于宏基因组功能研究。
2025-11-07 15:42:35
418
原创 metaboanalyst使用初探
进入https://www.metaboanalyst.ca/ 公司说这个表格是归一化过的,在网址里面点Concentration就可以。根据公司返回的代谢物相对丰度值(峰面积值),单位就是intensity,构建一个表。上述归一化是ai说的比较常用的。
2025-10-13 14:14:33
287
原创 CarveMe:代谢模型构建
本文介绍了CarveMe代谢网络重建工具的安装与使用流程。首先通过conda/mamba创建Python 3.9环境并安装1.6.6版本。详细说明了如何修改carve.py源代码以支持批量处理,包括添加递归模式参数处理和多进程功能。工具支持多种输入类型(蛋白质/DNA序列、eggNOG注释等),可进行模型重建、gap filling和ensemble生成。关键参数包括--universe指定反应库、--gapfill进行间隙填充、--ensemble生成模型集合等。最后给出了批量处理命令模板,支持通配符输入
2025-09-30 22:21:36
318
原创 PathogenFinder2:判断致病菌
PathogenFinder2 是一个用于病原体预测的基因组分析工具。安装步骤包括:1)创建并激活名为 PathogenFinder2 的 mamba 环境(Python 3.11);2)克隆 GitHub 仓库;3)通过 pip 安装。使用命令为"pathogenfinder2 predict -i 输入文件 -f 格式 -o 输出目录"。该工具相关预印本论文已发表在 bioRxiv(DOI:10.1101/2025.04.12.648497)。安装过程简单,适合快速部署用于病原体基因
2025-09-24 20:52:23
227
原创 KrakenUniq去宿主
摘要:本文介绍了使用krakenuniq进行分类分析的操作流程。首先通过mamba安装krakenuniq工具,然后下载牛基因组作为宿主参考序列并添加到数据库。接着下载分类学数据并构建索引(使用16线程)。最后运行krakenuniq分析双端测序数据,输出未分类和宿主分类的序列文件,以及结果报告。关键步骤包括数据库构建、分类数据下载和序列分类分析。
2025-09-22 10:05:04
192
原创 质粒预测软件:PlasFlow,geNomad,PlasClass
本文介绍了两种质粒预测工具PlasFlow和PlasClass的使用方法。PlasFlow需要先过滤短序列(>1000bp),然后运行预测;PlasClass可直接对fasta文件进行分类。两者均通过conda环境安装,提供简单易用的命令行界面,适用于基因组数据中的质粒序列识别。这些工具可帮助研究人员从宏基因组数据中准确分离质粒DNA。
2025-09-13 09:42:11
277
原创 ARGs_OAP:抗性基因注释(新增VFDB:毒力因子和mobileOG-db可移动元件)
本文介绍了使用ARGs-OAP工具分析宏基因组数据的流程。首先通过conda安装ARGs-OAPv3.2.4和SARGv3.2.1,创建专用环境。分析分为两个阶段:stage_one处理原始数据(支持fastq.gz格式),stage_two进行统计分析。注意双端测序数据需按规范命名(如_1/_2、_R1/_R2或_fwd/_rev结尾),否则会被视为单样本。命令行中指定输入输出目录和线程数(-t180)。该流程适用于宏基因组抗生素抗性基因分析。
2025-08-20 14:22:47
909
原创 测序原始数据上传公共数据库
NCBI提交包括三个步骤:1)创建Bioproject项目并填写元数据;2)提交Biosample样本信息,需注意表格格式要求;3)准备SRA数据提交,建议使用Aspera工具上传原始数据文件,需确保使用完整路径。文中特别强调了表格填写细节和文件上传注意事项,如避免重复行、使用绝对路径等
2025-07-22 08:25:51
1313
原创 BRAKER:真核微生物cds和蛋白注释
摘要:本文介绍BRAKER3基因组注释工具的使用流程。首先通过Docker运行测试脚本,生成GTF、FASTA和GFF3格式的基因集。然后详细说明RepeatMasker的安装和运行步骤:1)使用conda创建环境并安装软件;2)建立基因组数据库;3)运行RepeatModeler和RepeatMasker进行重复序列屏蔽。最后展示BRAKER3正式运行命令,使用屏蔽后的基因组和蛋白质序列进行注释。关键输出文件包括.masked文件和多种格式的注释结果。
2025-07-03 22:37:59
447
原创 EukDetect:基因标记基因的真核微生物注释
摘要:本文介绍了EukDetect软件在真菌组分析中的应用及其安装使用流程。EukDetect通过比对NCBI数据库中的标记基因来检测真核生物序列,具有较高的准确性。安装过程包括克隆GitHub仓库、下载数据库、创建conda环境等步骤。配置文件需设置输出路径、测序数据参数(如read长度150bp)、样本名称等关键信息。运行命令使用32个核心进行全流程分析。该工具为宏基因组数据中的真菌检测提供了有效解决方案,弥补了现有软件和数据库的不足。
2025-06-23 17:01:53
313
原创 EukCC:真核MAG完整性检验
摘要:EukCC是一款用于评估从宏基因组分析中获得真核生物基因组质量的工具。安装过程包括下载数据库(eukcc2_db_ver_1.2)并设置环境变量,通过conda创建eukcc环境并激活。使用时只需指定输入文件夹(包含.fa后缀的基因组文件)、输出文件夹和线程数等参数即可运行。该工具简化了真核基因组质量评估流程,适用于宏基因组学研究。
2025-06-19 16:00:08
310
原创 Deseq2:MAG相对丰度差异检验
本研究构建了一套完整的宏基因组关联分析流程:首先利用drep工具将contigs与MAGs进行关联,通过bwa-mem2进行序列比对并统计reads计数;随后开发Python脚本整合不同样本的raw reads数据,并通过contig-bin映射关系将计数转化为bin水平;最终使用DESeq2进行差异分析,识别显著差异的MAGs,并通过火山图可视化结果。
2025-05-31 20:38:48
376
原创 contigs的raw counts转化到bin的raw counts
摘要:该Python脚本用于将原始contig水平的reads计数聚合到bin水平。通过读取contig-to-bin映射文件和contig计数矩阵,脚本合并数据后按bin分组求和,最终输出bin水平的计数矩阵。
2025-05-31 17:01:07
305
原创 md5sum:批量检查文件是否完整
摘要:本文简要介绍了如何准备和使用MD5校验文件。首先需要准备一个包含校验信息的文件(如公司提供的文件),然后使用md5sum命令对该文件进行校验,生成md5.txt校验文件。这一过程通常用于验证文件的完整性和真实性。
2025-05-24 14:40:29
215
原创 CoverM:contig/bin的相对丰度计算
GitHub上的CoverM工具用于计算宏基因组学中的读段比对统计信息。安装过程包括使用Mamba创建环境、激活环境并安装CoverM。使用CoverM时,可以通过命令行工具coverm -h查看帮助信息。示例脚本展示了如何批量处理fastq.gz格式的测序数据,使用CoverM计算基因组的相对丰度和覆盖度,并将结果输出到指定目录。脚本首先激活conda环境,然后遍历指定目录下的文件,针对每个样本调用CoverM进行分析,最终生成统计结果文件。
2025-05-17 22:33:18
627
原创 MetaHipMer2:从头组装宏基因组
本文介绍了如何安装和配置MetaHipMer2(MHM2)环境,以支持Terabase级别的宏基因组共组装。首先,通过Conda创建并激活名为mhm2_env的环境,并安装必要的依赖项,如CMake、GCC、UPC++、Make、Git和CUDA工具包(如果需要GPU支持)。接着,下载并解压UPC++和MHM2的源代码,配置UPC++的安装路径,并编译安装。然后,通过修改build.sh脚本中的CMake配置,指定MPI C++编译器,并执行编译过程。最后,通过运行mhm2.py脚本验证安装是否成功。整个过
2025-05-14 22:12:05
349
原创 COMEBin:分箱软件安装与使用
GitHub项目ziyewang/COMEBin提供了一种通过对比多视图表示学习对宏基因组contigs进行有效分箱的方法,相关研究发表在《Nature Communications》上。安装过程包括使用Mamba创建环境、安装依赖包和GPU支持的PyTorch,以及克隆项目代码库。使用步骤涉及预处理生成BAM文件,包括构建索引、比对生成排序后的BAM文件,以及为排序的BAM文件建立索引。最后,激活环境并运行脚本进行分箱处理。这一流程旨在利用GPU加速,提高处理效率。
2025-05-13 13:32:11
252
原创 期刊缩写搜索 web of science法
进入endnotes--Library--Open Term lists--Journal Term lists。Edit Term,如果没有这个期刊,就New Term。找到缩写“ISO ABBREVIATION”
2025-03-17 13:45:06
590
原创 做16s/ITS发育树时发现比对结果很差
有可能是因为公司给的一代测序fasta和你在ncbi下载的fasta是反向互补序列的原因。翻转过来之后再去MEGA-X做多序列比对发现比对结果很好了,可以做树。
2025-03-11 15:39:12
175
原创 DRAM-v:病毒辅助代谢基因AMG注释
得到 Metric_files/VIRSorter_affi-contigs.tab。用作 DRAM-v 的输入。注释和蒸馏病毒重叠群需要一些预处理和额外的输入。参考上述博文获取DRAM-v的原理和结果构成。进行处理,处理后的病毒重叠群和。
2025-02-18 21:07:11
1777
8
原创 CRISPR spacers数据库;CRT和PILER-CR用于MAGs的spacers搜索
之前介绍了这个方法来预测病毒宿主,今天来介绍另一种比较用的多的方法CRISPR比对。
2025-02-16 20:11:33
769
3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅