- 博客(118)
- 收藏
- 关注
原创 期刊缩写搜索 web of science法
进入endnotes--Library--Open Term lists--Journal Term lists。Edit Term,如果没有这个期刊,就New Term。找到缩写“ISO ABBREVIATION”
2025-03-17 13:45:06
165
原创 做16s/ITS发育树时发现比对结果很差
有可能是因为公司给的一代测序fasta和你在ncbi下载的fasta是反向互补序列的原因。翻转过来之后再去MEGA-X做多序列比对发现比对结果很好了,可以做树。
2025-03-11 15:39:12
90
原创 DRAM-v:病毒辅助代谢基因AMG注释
得到 Metric_files/VIRSorter_affi-contigs.tab。用作 DRAM-v 的输入。注释和蒸馏病毒重叠群需要一些预处理和额外的输入。参考上述博文获取DRAM-v的原理和结果构成。进行处理,处理后的病毒重叠群和。
2025-02-18 21:07:11
345
原创 CRISPR spacers数据库;CRT和PILER-CR用于MAGs的spacers搜索
之前介绍了这个方法来预测病毒宿主,今天来介绍另一种比较用的多的方法CRISPR比对。
2025-02-16 20:11:33
454
3
原创 eggnog后kegg结果提取和注释
kegg的对应level,在excel钟使用vlookup函数对应即可。写个代码看看把keggKO和tpm关联起来。用python处理一下。
2025-02-08 00:09:42
375
原创 BAT:确定宏基因组bin的物种(GTDB-tk注释较差的时候)
今天用GTDB-tk注释了我的几百个bin,结果一坨family水平的都有大量不可读的注释因此,尝试用BAT做注释,BAT是CAT软件中的一个部分。
2024-12-05 13:59:46
213
原创 MaAsLin2:确定表型、环境、暴露、协变量和微生物元组学特征之间的多变量关联
对于模型,如果您的输入是计数,则可以使用NEGBIN(负二项分布)和ZINB(零膨胀负二项分布),而对于非计数(例如百分比、CPM或相对丰度)输入,您可以使用LM(线性模型)和CPLM(复合泊松线性模型)。在MaAsLin中,可以用于关联测试的有几种不同类型的统计模型。metadata示例。taxonomy示例。
2024-12-02 09:29:24
517
原创 宏基因组:MAG丰度计算(个人想法)
步骤:将去冗余的MAGs的所有contig,构建bin_contig关系后,合并为一个fasta文件,以这个文件为reference,构建bwa-mem2的index,然后将所有样品的clean_reads映射map到这个reference上,根据比对情况求取所有contigs的TPM,最后将同一bin的contigs的TPM进行求和,得到MAGs的TPM表格。
2024-11-30 20:29:47
536
原创 16S,18S引物覆盖度测试:SILVA和PR2
结果进入:Inspect Results inTaxonomy Browser。可选择感兴趣的物种group,红框里面的是覆盖度和扩增长度。进入:Test your primer set。
2024-11-12 11:04:48
398
原创 宏转录组组装:rnaSPAdes
之前写过Trinity,也是个老牌软件今天看文献有人用rnaSPAdes,可能大家比较了解SPAdes,用在宏基因组和单菌组装比较多之前也写过,在下载metaSPAdes时,其实已经把rnaSPAdes给下载了。
2024-11-06 20:27:13
457
原创 查找rRNA:barrnap,宏转录组去除rRNA:SortMeRNA
【代码】查找rRNA:barrnap,宏转录组去除rRNA:SortMeRNA。
2024-11-05 15:04:25
337
原创 COG注释字母意思
细胞周期控制,细胞分裂,染色体分离。次级代谢产物的生物合成,转运和分解。翻译后修饰,蛋白质降解,分子伴侣。细胞内运输,分泌,和囊泡转运。可动基因组:原噬菌体,转座子。翻译,核糖体结构和生物发生。细胞壁/膜/包膜生物发生。碳水化合物转运和代谢。
2024-07-20 21:13:29
533
原创 statswrapper.sh 对多个fastq/fasta文件进行基础信息计算
statswrapper.sh是来源于bbmap的一个工具,bbmap的安装可见。statswrapper.sh工具可对多个数据同时进行运算。
2024-07-11 09:56:26
294
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人