- 博客(46)
- 资源 (16)
- 问答 (1)
- 收藏
- 关注
原创 prokka运行报错:‘contigs.fasta‘ is not a readable non-empty FASTA file in prokka docker
由于用conda安装prokka一直失败,最后选择docker安装,但运行时报错:‘contigs.fasta’ is not a readable non-empty FASTA file in prokka docker。:这主要是因为在利用docker镜像时没有将本地文件挂载到docker镜像,docker类似一个虚拟机,如果我们没有把本地文件挂载进去,docker就无法访问文件内容,就会出现如上报错。表示将当前工作目录挂载到docker镜像中的根目录下的data文件夹。,所以docker镜像中的。
2025-01-06 10:33:45
201
原创 交互式探索微生物群落与生态功能的关系
微生物群落在生态系统中发挥则重要功能,我们在对微生物群落进行分析时,会。但由于微生物类群数较多,又有不同的分类水平,将其包揽在一个图中,并显示不同的微生物类群的名字,会显得十分杂乱,因此我们尝试使用交互式的可视化来进行探索性分析。下面我们将结合R语言和javascript,来实现这一任务。考虑到微生物生态学方面的同学对JavaScript可能比较陌生,我们也提供了网络工具,为网友在线探索分析微生物各类群与生态功能的关系提供便利。
2024-04-23 14:28:53
787
2
原创 R语言绘制一次和二次相关性热图
变量间的关系并非总是线性,例如:我们熟知的微生物物种多样性与土壤pH之间的关系,因此在数据探索过程中,仅使用线性相关会导致我们遗漏一些重要信息。二次关系也需要纳入我们考虑的范围,因此本篇博客将对两两变量的二次关系的R代码及可视化进行介绍,助力数据探索。
2024-04-11 17:24:25
605
原创 python基于opencv实现数籽粒
千粒重是一个重要的农艺性状,通过对其的测量和研究,我们可以更好地理解作物的生长状况,优化农业生产,提高作物产量和品质。但数籽粒数目是一个很繁琐和痛苦的过程,我们现在用一个简单的python程序来数水稻籽粒。代码的大致流程如下: 1. 对照片进行预处理,包括灰度化、二值化等操作,以便更好地识别籽粒。 2. 使用轮廓检测算法来找到照片中的籽粒,并计算轮廓面积; 3. 对轮廓面积进行判断,以便区分重叠的籽粒。 4. 计算籽粒数目,将结果输出到屏幕上或保存到文件中。
2024-04-08 08:40:08
735
1
原创 微生物群落关键种识别:一种不依赖于网络的自上而下的方法
微生物群落在促进养分循环、协助植物生长、维持人体健康等方面发挥着重要的作用。群落关键种对维持微生物群落稳定性具有重要影响,识别关键种一直是微生物生态学中的热点话题。
2024-04-03 15:40:10
1716
2
原创 英文论文实例赏析——如何写前言?
写作与实验、统计一样重要研究生的学习往往会遵循这样的过程:实验——数据分析——写作。虽然写作是最后进行的,但写作的学习这应该和实验的学习、数据分析的学习保持同步,因为写作与统计和实验技能一样,是科研工具箱的必备武器。
2023-10-07 18:22:24
262
原创 从序列到特征表:DADA2/Deblur/UNOISE in VSEARCH三种流程的分析脚本
DADA2、deblur、vsearch unoise分析脚本介绍
2023-08-03 11:20:28
917
原创 利用GPU并行计算beta-NTI,大幅减少群落构建计算时间
18个样本,抽平到8500条序列,4344个OTUs,计算beta-NTI共花费时间如下:> GPU(GTX1050):1分20秒> iCAMP包 的`bNTIn.p()` 函数4核并行:约16分钟如果更好的显卡,更大的数据量,节约的时间应该更加可观。
2023-05-15 18:06:51
2968
5
原创 VBA替换中文文献引用出现的et al.和and
endnote管理中文文献及其双语引用: https://blog.youkuaiyun.com/rookieWhoCanProduce/article/details/115326114。虽然用替换或手动修改也可以解决上述问题,但如果论文篇幅较长(如:学位论文)或者需要反复修改(好不容易把。问题描述:Endnote是常用的文献管理工具,并提供国标模板。,背离了Endnote的使用逻辑。,若需要再插入文献,更新Endnote后。使用序号的形式(******的形式进行引用,例如:使用。张三, et al.
2023-04-30 13:49:29
1447
原创 Qiime2 ASV特征名简化修改
使用Qiime2生成的feature table(特征表),注释文件以及代表性序列中的ASV名称往往是很长的一段数字(如:“84b577b185f76483981b055fc7c878cb”),我们可以用如下代码将这些ASV的特征名称修改为ASV1、ASV2、ASV3……这样的形式。“84b577b185f76483981b055fc7c878cb”),我们可以用如下代码将这些ASV的特征名称修改为ASV1、ASV2、ASV3……
2022-11-02 13:18:57
1667
3
原创 python openpyxl + VBA控制Excel批量绘制两两散点图
尽管R语言是进行生态环境数据探索的首选,但Excel无疑在我们搜集、整理以及初步数据探索中依旧有着十分重要的作用。绘制环境因子间的两两散点图是探索因子关系的常见步骤,当环境因子较多时scatterplotMatrix()显得力不从心,当因子间的关系不是简单的线性关系时,corrplot()也不能完全展示数据间的关系。这里我们用python的openpyxl包控制excel绘制11个变量间的两两散点图。
2022-10-26 17:28:08
1671
原创 随机森林评价变量重要性可以无条件信任吗?
随机森林在生态环境的研究中被广泛应用,但其局限性往往会被忽视。本文将对随机森林评价变量重要性的局限进行探讨和验证。
2022-09-06 11:19:00
1265
原创 探索性数据分析:将OTUs与生态过程相关联——基于模型的方法
譬如:我想探究某一生态过程(有机质的分解、反硝化作用等)与微生物群落结构的关系。这些生态过程可能和alpha多样性,群落结构的NMDS1等等都没什么关系,此时如何快速地确定与该生态过程显著相关的OTUs,基于模型的方法可以实现这一点。下面以gllvm包探索与某一生态过程显著相关的OTUs。
2022-04-27 16:44:54
1143
原创 基于模型的共现网络构建——考虑环境因子的影响
目前很多构建共现网络的方法(sparCC、speicEASI、spearman correlation等等)均包含环境因子对网络的影响——例如,如果两个OTU均喜欢酸性环境,那么他们就会有很强的的相关性,所以由此构建的共现网络反映了环境因子和生物互作共同的影响,我们称其为raw co-occurrence network(原始共现网络)。与上述方法不同的是,基于模型的共现网络构建可以在其中考虑到环境因子的影响,从而将环境因子的影响排除出去,更好地反映微生物交互作用。不过也可能有其它未检测到的环境因子,
2022-04-22 09:25:40
3817
原创 基于模型的约束排序,并探究OTUs对pH的响应特征——单峰or线性?
排序是微生物生态学中分析微生物格局常用方法,包括非约束排序和约束排序。非约束排序可以很直观地观察各样点或处理间微生物群落结构的变化情况,常用的有基于各种生态距离(beta多样性,最常用的Bray-Curtis距离、Jaccard距离等)的NMDS、PCoA和t-SNE降维,基于卡方距离的对应分析(CA,correspondence analysis )和基于欧氏距离的PCA分析。约束排序可以探索环境因子对微生物群落结构的影响常用的有:RDA、CCA或基于距离的RDA(db-RDA)。这些方法都会通过一些
2022-04-20 15:17:17
1601
原创 检测OTU序列遗传发育信号的R实现
群落格局及其背后的构建机制是群落生态学研究的重点内容,Stegen et al. 在2011年使用了beta-NTI这一指标来推断群落构建,此后得到了微生物生态学家的广泛使用。使用beta-NTI推断群落构建有一个前提条,就是该基因必须在较小的遗传距离上具有遗传发育信号(Q1:为什么这是必须的呢?),即在较小的遗传距离下,遗传发育距离越大,其生态位距离越大(Q2:为什么是较小的遗传距离下有遗传距离发育信号即可,不需要整个的遗传距离呢?)。本文将介绍三种方法检测近距离下的遗传发育信号,并用R语言实现。
2022-04-01 20:17:36
1433
原创 冗余分析(RDA)中若包含生物学重复会怎样?
一般微生物测序实验会包含三个生物学重复,然后获得有重复的OTU table和环境因子的数据。许多文献在对OTUs进行冗余分析时都包含了重复,包含重复与不包含重复会有何种不同?是否会影响我们对分析结果的解读呢?下面我们以基于距离的冗余分析(db-RDA)作为例子,尝试分析一下,看看两者的区别。
2022-03-31 16:25:34
1137
原创 微生物共现网络模块的遗传发育特征分析
影响微生物共现网络的两个主要因素为:环境筛选和微生物交互作用,而这两者背后都有一个共同的影响因素——遗传发育特征。我们之前介绍了如何探究环境因子对微生物共现网络的影响,这里我们将分析微生物共现网络模块的遗传发育特征,回答这样一个问题:属于同一模块的OTUs是否具有更相似的遗传发育特征?
2022-03-30 16:14:56
2245
原创 Sloan中性群落模型(NCM)推断群落构建原理及其R实现
许多SCI文章都使用了一种叫NCM的方法来对微生物群落构建(中性理论 or 生态位理论?)进行预测,本文将对NCM的实现原理及其R实现做介绍。在介绍其原理的过程中会有一些数学公式,不要对这些数学公式产生抵触情绪,我会解释其每一项的生态学含义。与原理相比,其R实现则相对简单,阅读完后可将原理与R实现进行对比学习。
2022-03-23 15:48:16
14177
20
原创 探究微生物共现网络与环境因子的关系
探究微生物共现网络与环境因子的关系是微生物生态学分析的常用手段之一,目前的文献使用的主要包括以下三种方法:Modular Eigengene ,Subgraph of each sample和OTU significance
2022-03-11 11:12:33
5273
原创 计算网络节点模块内连通度(within modular degree)和模块间连通度(between modular degree)
我们可以通过了解节点的模块内连通度和模块间连通度来对节点的重要性进行度量,具有较低的模块内连通度和模块间连通度的节点的重要性则相对较低。
2022-03-10 17:49:12
11539
23
原创 利用随机矩阵理论(random matrix theory)确定微生物网络构建阈值
利用随机矩阵理论(random matrix theory)确定微生物网络构建阈值
2022-02-28 12:01:01
5716
41
原创 向量化代码计算spearman两两相关系数与显著性,加快微生物网络构建。
向量化代码计算spearman两两相关系数与显著性,加快微生物网络构建
2022-02-28 11:29:04
1472
原创 根据代表性序列预测OTU/ASV生活史策略——寡营养型or富营养型
丰富的资源会促进细菌的生长,特别是富营养型细菌的生长。快速的生长需要大量的核糖体,富营养性细菌会持有更多的核糖体RNA操纵子(number of ribosomal RNA operons, rrn)。因此我们可以根据核糖体RNA操纵子的数目来对寡营养型和富营养型细菌进行区分,而且核糖体RNA操纵子的数目在16srRNA序列上保守,因此我们可以通过分类信息对核糖体RNA操纵子数进行预测。
2022-02-13 15:59:17
4698
原创 微生物网络分析学习手稿
拟回答以下3个问题并用R语言实现:1. 构建网络常用的方法及原理2. Cross-kingdom网络的构建3. 环境因子与网络拓扑参数的关系
2022-02-11 16:05:29
2792
2
原创 R语言并行计算RC~bray-curtis~距离
;群落构建分析是微生物生态学分析的重要组成部分,成为目前文章发表的热点技术。之前我们介绍了计算beta-NTI(beta nearest taxon index)来进行群落构建分析。|beta-NTI| >2说明决定性过程主导,其中beta-NTI >2说明OTU的遗传距离发散,为生物交互作用主导,beta-NTI < -2则说明OUT的遗传距离收敛为环境选择主导。|beta-NTI|
2022-02-07 21:07:55
8853
47
原创 如何批量将手写数据转Excel?
做实验的过程中往往需要记录数据,比如笔者有时需要测定上百个DNA样品的浓度,有时又需要去野外实验地记录田间数据,手写记录目前还是最可靠、最便捷、最有效的方法。但手写数据需要录入电脑进行数据分析,录入的过程往往相当繁琐,没有任何技术可言,那么如何让手写数据更快更高效地录入电脑,从而提高我们学习工作的效率呢?那么就让我们一起用python来解决这个问题吧。
2022-02-07 17:27:24
8020
11
原创 R语言并行计算 deviation of null beta diversity(beta多样性零偏差)
群落构建分析是微生物生态学分析的重要组成部分,成为目前文章发表的热点技术。之前我们介绍了计算beta-NTI(beta nearest taxon index)来进行群落构建分析。|beta-NTI| >2说明决定性过程主导,其中beta-NTI >2说明OTU的遗传距离发散,为生物交互作用主导,beta-NTI < -2则说明OUT的遗传距离收敛为环境选择主导。|beta-NTI|
2022-02-07 11:41:45
4167
原创 睡前必备神器——倒计时定时关闭手机音乐声音APP
平时喜欢睡前听新闻,有些APP中没有定时关闭的功能,这样睡前听东西就很不方便,有时候睡着了又被吵醒。于是我就想找一款能定时关闭声音的APP,但始终没找到,只好自己动手。虽然自己不是程序员,但由于这种强烈的需求驱动着自己去学习和探索,再加上网络上有那么多资源,实现起来应该也不难。之前尝试用python的kivy来做,毕竟平时分析数据对python比较熟悉些,但不知道怎么使用kivy控制系统音量,而且网络上kivy的教程相对kotlin而言要少很多,只好放弃比较熟悉的python,转向kotli...
2022-02-07 11:20:23
4313
原创 扩增子测序分析平台之外接固态硬盘
16s扩增子测序分析平台——固态硬盘 我在学习16测序过程中,使用了该外接硬盘,觉得非常适合初学者,有很好的指导意义,在此与和我一样的初学者分享我的使用体会。 随着高通量测序费用的不断降低,微生物的扩增子测序分析已经应用到了各个学科当中。但很多从事其它学科的学生对16s扩增子测序的分析并不十分熟悉,因此网络上出现了很多教程和视频来帮助初学者进行学习。尽管如此,学习这些教程有一个前提,那就是首先得拥有一个可以进行分析练习的平台。获取分析平台可以有多种途径:安装虚拟机来练习,其实安装虚拟机练习
2022-01-26 11:02:32
353
原创 Ubuntu系统下R语言更新和包安装的若干问题
Ubuntu系统下R语言更新和包安装的若干问题保持最新的R软件有利于使用更多的包,因为会有些程序包不支持旧版本的R。我今天(2021年7月7日)对我的R进行了更新,也迁移了旧版本R中的程序包,下面以问题的形式总结一下我在途中遇到的一些问题。为什么我用如下代码更新R总是不成功?#不要将sudo apt-get update与该命令混淆sudo apt-get upgrade答:因为显示我的秘钥已经过期了,需要对秘钥进行更新。我根据如下链接进行了操作:https://www.bentoh.m
2022-01-08 18:41:08
823
原创 R语言并行计算spearman相关系数
利用spearman相关性分析是构建共现网络的重要方法,但由于OTU table往往有成千上万行,用R自带的corr.test()函数计算较为费时,严重制约我们的分析速度。对spearman相关性分析进行并行化运行可大大节省计算时间,为此我们手写了spearman相关性分析函数来实现并行化运行。为方便讲解,本文以我们常见的OTU table 数据为例,对OTU进行两两spearman相关性分析,获得相关系数r和显著性p值。我们将自己手写的函数network_construct()与psych包中的corr.
2021-09-19 20:51:50
10412
10
python基于opencv实现籽粒计数
2024-04-08
微生物共现网络可视化:按模块进行圆形布局
2022-11-15
随机森林评价变量重要性可以无条件信任吗?
2022-10-31
基于模型的约束排序,并探究OTUs对pH的响应特征——单峰or线性?
2022-04-20
OTU遗传发育信号检验
2022-04-01
生物学重复对RDA分析的影响
2022-03-31
探究共现网络模块的遗传发育特征
2022-03-30
探究微生物共现网络与环境因子的关系-测试数据与R代码
2022-03-11
计算网络节点模块内连通度和模块间连通度
2022-03-10
R语言向量化计算spearman相关系数及RMT确定阈值
2022-02-28
根据代表性序列预测OTU/ASV生活史策略——寡营养型or富营养型
2022-02-13
R语言并行计算RC~bray-curtis~距离
2022-02-07
手写实验数据批量转Excel的python脚本及EXE文件
2022-02-07
倒计时定时关闭手机音乐声音APP——适用于安卓手机
2022-02-07
微生物网络分析:网络鲁棒性评价
2022-01-24
R语言并行计算beta多样性零偏差值.zip
2021-12-29
R语言并行计算beta-NTI代码和测试文件.zip
2021-09-12
R语言并行计算spearman相关系数代码和测试文件.zip
2021-09-12
自定义模型的参数估计与显著性检验
2022-05-09
TA创建的收藏夹 TA关注的收藏夹
TA关注的人