- 博客(144)
- 收藏
- 关注
原创 HRGM2:涵盖 41 个国家的的人类肠道MAGs目录,支持基因组规模代谢模型
人类肠道微生物组研究依赖于全面的基因组目录,然而现有资源存在地理多样性不足和基因组质量不高的问题。许多目录包含中等质量的宏基因组组装基因组(MQ MAGs),这些基因组可能缺失高达50%的基因组区域,从而扭曲功能分析结果。这篇研究介绍了增强版的人类参考肠道微生物组(HRGM2)资源,这是一个包含近完整MAGs(≥90%完整性,≤5%污染率)和分离株基因组的目录。
2025-12-25 11:31:05
581
原创 生态系统健康塑造泥炭地土壤中的病毒生态|Nature Microbiology
泥炭地储存了地球土壤碳的三分之一,但由于人类活动的影响,正从碳汇转变为碳源。恢复工作旨在逆转这一趋势,但病毒对泥炭地恢复的影响尚不明确,尽管病毒是微生物组和生态系统功能的重要调节因子。本研究通过对英国七个泥炭地的土壤宏基因组进行测序,分析了自然、受损和恢复三种生态系统健康状态下的病毒群落。研究发现,病毒多样性和群落结构受地理和生态系统健康的共同影响。病毒广泛分布,但表现出生态系统健康特异的地方性和功能适应,凸显了其对恢复的敏感性。
2025-12-25 11:30:38
762
原创 R语言实现倾向性评分匹配(PSM)
倾向性评分(Propensity Score, PS)定义为:在给定一组协变量X的条件下,个体接受处理的条件概率,即PS = P(T=1|X)。其中T为处理变量(1=接受处理,0=未接受处理),X为所有可能影响处理分配和结果的预处理协变量。
2025-12-22 17:56:17
988
原创 ResMicroDb:人类呼吸道微生物组综合数据库与分析平台
呼吸道微生物组在维持人体健康中扮演着重要角色。尽管相关文献和公共数据快速增长,目前仍缺乏大规模、高质量注释的呼吸道微生物组数据库。ResMicroDb整合了来自514个项目的106,464个样本,覆盖10个采样部位、72种样本类型和146种表型,并提供了标准化分析流程生成的物种注释谱、手动整理的32项元数据字段,以及基于132项病例对照研究鉴定的11,908条微生物-疾病关联。平台还集成了微生物组成可视化、样本相似性搜索和跨研究分析三大工具,支持用户深入探索呼吸道微生物组的分布特征与健康关联。
2025-12-22 17:30:34
701
原创 寒冷适应和HGT塑造南极海绵微生物组
值得注意的是,冷休克蛋白C(CspC)与寒冷适应密切相关,该基因仅存在于Proteobacteria中,且是海绵共生菌中潜在的水平获得基因,而在南极海洋生态系统的自由生活细菌中未见表达。值得注意的是,三个来自深海的热带海绵样品也显示出某些寒冷适应功能的增强表达,特别是N. huxleyi物种,其寒冷适应功能谱与南极海绵表现出惊人的相似性。本研究旨在系统探讨南极海绵微生物组的功能组成如何区别于其他环境的海绵,特别关注与寒冷适应相关的功能特征,并评估水平基因转移在驱动这些功能适应中的重要作用。
2025-12-15 16:45:21
991
原创 冰川微生物基因组与基因数据库:三极地区的综合资源
冰川覆盖地球陆地面积的10%,是碳和氮的重要储存库,对下游生态系统的元素循环具有深远影响。微生物(包括细菌、古菌、真菌和藻类)作为冰川生态系统的主要生物群落,驱动着碳、氮等关键元素的生物地球化学转化。这篇研究整合了南极、北极、青藏高原及其他高山冰川的表层(包括冰、雪和冰尘)原核生物(细菌和古菌)数据,构建了一个涵盖2039个扩增子测序样本、999个培养细菌基因组和208个宏基因组的综合数据库。
2025-12-15 16:44:55
721
原创 Snakemake入门和搭配Slurm使用
它由德国杜塞尔多夫大学 Johannes Köster 团队开发,自 2012 年发布以来,已成为生物信息学领域事实上的标准之一。🐍 GitHub 示例库:https://github.com/snakemake-workflows。Snakemake 根据 output → input 的链条,自动生成有向无环图(DAG)。无论是 PI、博士生还是生信工程师,掌握 Snakemake 都将极大提升你的科研效率与成果可信度。的文件中(无需后缀),使用 Python 语法子集。大多数高校 HPC 使用。
2025-12-05 09:48:18
623
原创 VIRE:具有环境背景的全球尺度病毒组资源
VIRE数据库主要包括从总共101,623个公开可用的批量和病毒组(VLP富集)宏基因组数据集中重建的1,784,510个中等或高质量病毒基因组(定义为至少>50%完整性和<10%污染)。CheckV的质量评估将这些基因组分类为384,035个完整、417,105个高质量和983,370个中等质量基因组。除了这些宏基因组来源的序列外,VIRE还包括从RefSeq/GenBank下载的12,916个病毒基因组。
2025-12-05 09:47:56
780
原创 使用Pixi进行包管理(入门)
Pixi 是由prefix.dev开发的一款快速、可复现、跨语言的包管理与任务运行工具。依赖混乱:Python、Rust、C++、Node.js 等语言的包分散在不同系统中;环境不可复现:今天能跑的代码,明天换台电脑就报错;脚本管理困难:测试、构建、部署命令散落在文档或 shell 脚本里。Pixi 通过一个统一的配置文件pixi.toml和一个命令行工具pixi,将依赖管理、环境隔离、任务执行全部整合在一起,支持 Linux、macOS 和 Windows。它底层使用 Rust 编写的。
2025-12-01 01:11:38
707
原创 microbetag通过注释、富集和代谢互补分析帮助微生物网络解读
microbetag整合了四个方面的注释来源——两个针对节点,两个针对边。在线模式:用户提供的分类单元被映射到其最接近的 GTDB 代表基因组,以便进行下游注释。本地模式:使用用户自定义的基因组作为输入。在节点层面与每个分类单元相关的基因组。其分类学身份,使用基于文献整理的 FAPROTAX 数据库。在边层面microbetag途径互补性种子互补性注释后的网络可以通过专用的 Cytoscape 应用程序MGG进行可视化。microbetag。
2025-12-01 01:08:52
677
原创 宏基因组分箱(binning)|5. Bin Chicken靶向共组装
传统宏基因组分析通常依赖于对单个样本进行独立组装,随后通过分箱(binning)步骤将重叠群(contigs)聚类为潜在的基因组单元。该流程在处理高丰度物种时表现良好,但在面对低丰度成员时则常因覆盖度不足而导致组装碎片化,难以获得完整基因组。此外,当多个近缘菌株共存时,组装算法易将它们错误地合并为一个嵌合体,进一步降低 MAG 的准确性。尽管已有多种共组装策略尝试整合多个相关样本以提高覆盖深度,但盲目合并所有样本不仅会引入大量无关序列,增加计算负担,还可能加剧菌株混杂问题。
2025-11-27 08:33:34
319
原创 肠道微生物组塑造跨动物物种的社会行为
肠道微生物组,即定植于动物胃肠道的复杂微生物群落,对宿主大脑活动和复杂行为具有深远且不可忽视的影响。近年来,跨越从无脊椎动物到哺乳动物乃至人类的研究,无论是在可控的实验室环境还是在自然生态条件下,均已逐步揭示出肠道微生物组参与调控社会行为的精细生物学机制。一个逐渐清晰的核心主题是,肠道微生物组与社会性之间存在着一种双向互动的紧密关系:社会性行为(如群居、理毛、合作)为微生物的传播提供了渠道,反之,微生物组也通过调节宿主的生理状态,主动贡献于社会性的表达与维持。Griffiths, J.A., Nirmalk
2025-11-18 16:16:13
378
原创 冰冻圈微生物生态系统中气候变化的当前与预期效应
寒冷环境,包括冰川、冰盖、多年冻土和海冰,在地球表面广泛分布,构成了全球冰冻圈的重要组成部分。尽管生命在零度以下的低温环境中面临严峻挑战,但全球冰冻圈却孕育着令人惊叹的微生物多样性。这些微生物群落是冰冻圈生态系统功能的核心驱动者,在其他生物难以存活的极端条件下,主导着关键的生物地球化学循环过程。然而,持续的气候变化,尤其是在极地地区产生放大效应的气候变化,正以前所未有的方式威胁着冰冻圈微生物群落的组成、代谢功能及其赖以生存的冰冻圈生境本身。Sugden, S., Davis, C.L., Quinn, M.
2025-11-18 16:05:41
1295
原创 病毒出现与全球大流行预防:同一健康框架下的视角
作为一种替代方案,可以监测频繁接触动物的人群是否存在新型和现有的人畜共患病毒,而非直接监测动物。尽管有这些估计,但关于同一健康方法经济效益的证据很少,关于可能改变大流行风险的当前实践的成本效益分析也很少,这些分析考虑了生物多样性、健康和气候的影响。此外,许多驱动因素本质上是人为的,这也为调整我们当前的行为及其对人类、动物和环境健康的影响提供了机会,从而预防新的大流行。最有可能的是,真实的风险预测需要更精细的信息,涉及当地实践,并结合关于病毒感染和暴露的实验室数据、接触率信息、动物建模和环境驱动因素。
2025-11-12 13:51:49
768
原创 NCBI不维护?试试上传数据至ENA
在 ENA 中,Metagenome-Assembled Genome(MAG)定义为:基于一个或多个已分箱(binned)的宏基因组(metagenome)所得的、单一分类群(single-taxon)组装,该组装被断言为接近一个真实个体基因组(可能匹配已有的纯培养菌株,或者代表一个新发现的菌株)。但最近因为资金短缺,NCBI各种业务暂停维护,但大家投文章又很着急满足杂志社的数据公开政策,ENA就成了重要的一个选择(上传到国内的CNGB有些杂志和审稿人不认可,唉。),所以在此更新一下上传的步骤。
2025-11-12 13:47:18
1340
原创 呼吸道病毒组:揭示病毒暗物质在呼吸健康与疾病中的作用
人类微生物组是指栖息在身体不同解剖部位的多种微生物群落,包括细菌、真菌、古菌和病毒。与真菌(真菌组)和细菌(细菌组)一起,这个生态系统的病毒组成部分被称为病毒组(术语表见表1)。病毒组包括感染人类细胞的真核病毒、感染细菌、真菌或古菌宿主的病毒,以及整合的逆转录病毒元件,还有非人类宿主的病毒,如植物病毒,通常通过环境暴露或饮食获得。人类病毒组从出生开始建立,具有时间动态性,并且在丰度、多样性和组成上在不同解剖部位之间表现出异质性。呼吸道病毒组受环境因素影响,包括饮食、地理、年龄、出生方式和母乳喂养。尽管肺部微
2025-11-07 15:21:12
725
原创 细菌细胞膜靶向抗生素:对抗多重耐药菌的新策略
攻击细胞膜还有其他吸引人的考量:虽然坚固的细胞膜阻止抗生素进入,但构建这些防御结构对细菌而言是一项复杂任务,需要专门的酶机制和必需建筑材料——这些独特成分正是抗生素可以利用的细菌"盔甲裂缝"。细菌膜中的许多靶点仍临床开发不足,针对这些靶点的化合物具有新的化学骨架,可拓宽作用靶点和模式空间,从而降低交叉耐药可能性。此外,作用于非蛋白质膜靶点(如脂质)的抗生素通常更不易产生耐药性,因为这些非基因组编码靶点的修饰需要细菌酶机制的深刻改变。所有分枝杆菌共有的复杂性是其巨大的细胞膜,保护菌体免受抗生素进入。
2025-11-07 15:20:34
1440
原创 从基因组视角解析真菌的多样性与进化
真菌是真核生物中最古老的界之一,其起源可追溯至约18.4亿年前。据估计,真菌界包含220万至620万种物种,但目前仅有约20万个物种被正式命名和描述,显示出巨大的多样性缺口。真菌的系统发育和表型多样性极为丰富:例如,仅酵母亚门(Saccharomycotina)内的遗传差异就超过了人类与蛔虫的差异,甚至超过了整个绿色植物界的差异水平。
2025-11-04 23:45:00
911
原创 细菌移动遗传元件间的互作与进化关系
移动遗传元件(Mobile Genetic Elements, MGEs)对包括细菌在内的生物体的生态学与进化过程具有深远影响。过去二十年间,大量新型MGEs被发现,且这些元件目前在不同细菌谱系中呈现普遍存在的特征。随着新型MGEs类别的快速涌现,一系列新的缩写术语随之产生,给相关研究的理解与交流带来挑战。更重要的是,现有研究已明确MGEs之间存在复杂的进化关联与分子互作,这些元件并非独立发挥作用的离散遗传实体。
2025-11-04 23:44:38
941
原创 使用GenomeSPOT从氨基酸组成预测微生物生长条件
目前微生物学和环境微生物学中,有很大一部分微生物尚未被成功培养(即“不可培养”微生物)。这部分原因在于难以确定其适宜的培养条件(如氧气要求、最适温度、pH、盐度等)。虽然有方法可以通过基因组中注释出的代谢基因来预测碳源或能量代谢方式,但对于诸如氧气耐性、温度、pH、盐度等“培养条件参数”,基于功能基因的预测比较困难,特别是在基因注释不完整或未知功能基因广泛存在的情况下。如果能从基因组层面(不依赖于详细注释)就预测这些培养需求,就能为实验室尝试培养更多微生物提供指导。
2025-10-14 05:34:04
946
原创 使用CRISPRCasTyper注释和分类CRISPR-Cas基因
CRISPRCasTyper是一款新型自动化软件工具,用于在原核生物序列中识别和分类CRISPR阵列和cas基因座。该工具基于最新的CRISPR-Cas系统分类和命名法(包含39种亚型/变体),采用机器学习方法对CRISPR阵列的直接重复序列进行亚型分类,能够对孤儿和远缘阵列进行分型。该工具提供图形化输出,以彩色基因图谱形式可视化CRISPR和cas操纵子结构,支持通过同线性分析注释部分和新系统。CRISPRCasTyper在包含31种亚型/变体的手动策划数据集上进行了基准测试,中位准确率达到98.6%。
2025-10-14 05:33:37
760
1
原创 呼吸道病毒共感染:相互作用、机制及临床意义
该文章系统梳理了呼吸道病毒共感染领域的研究进展,从群体、宿主和细胞层面深入剖析了异源呼吸道病毒间的相互作用,及其对病原体流行率和疾病严重程度的影响,为未来呼吸道病毒感染的防控策略提供了重要参考。
2025-10-08 15:25:30
861
原创 微生物次生代谢产物:加速从发现到应用的研究进展
在Nature Reviews Microbiology期刊发表的题为“Microbial secondary metabolites: advancements to accelerate discovery towards application”的综述文章,系统阐述了微生物次生代谢产物研究领域的最新进展,为推动该领域从基础研究走向实际应用提供了全面且深入的参考。
2025-10-08 15:25:07
1263
原创 宏转录组学揭示人体皮肤微生物活性图景(宏转录组分析参考)
研究团队开发了一套稳健的皮肤宏转录组学工作流程,通过优化采样、提取、rRNA去除、污染过滤及功能分类,解决了皮肤微生物生物量低的难题。该流程与宏基因组学联合应用,可实现转录活性标准化并捕捉菌株差异,且基于拭子的无创采样适用于多部位与大规模临床研究,不过在低生物量部位(如肘前窝)仍需优化以减少核酸损失。计算流程虽提供了重要功能见解,但需进一步与HuMAnN3等工具 benchmarking。
2025-10-02 20:46:19
1050
原创 全球公共交通系统空气病毒特征(宏基因组病毒分析参考)
因此,该研究分析全球六个城市(丹佛、香港、伦敦、纽约、奥斯陆、斯德哥尔摩)公共交通系统空气样本的503个宏基因组,旨在明确空气传播病毒的多样性、组成及功能潜力,探究病毒与宿主的CRISPR-Cas系统和Acr蛋白协同进化,以及病毒生活方式与宿主丰度的关系,并假设病毒生物学特征具有生物地理分布模式,且病毒-宿主相互作用受建筑环境条件影响。此外,在511个vOTUs中识别出1247个假定AMGs,147个可与体内宿主关联,携带AMGs的vOTUs中53.3%为毒性型,31.9%为温和型。
2025-10-02 20:45:10
893
原创 抗菌肽(AMP)的结构,功能和应用;相关数据库及预测方法
在人类与病原体的长期对抗过程中,微生物耐药性已发展为全球性公共卫生挑战。传统抗生素的不合理使用导致大量致病菌产生耐药性,而抗菌肽(Antimicrobial Peptides, AMPs)凭借独特的分子结构与作用机制,成为新一代抗感染治疗策略的重要研究对象。AMPs 广泛存在于各类生物体内,长度多在 10-100 个氨基酸残基之间,主要通过破坏细菌细胞膜完整性发挥作用,且耐药性进化率低、与传统抗生素交叉耐药性弱。这里我们先介绍一篇最新的AMP相关综述,然后介绍一下相关数据库和生信预测方法。2025年发表于《
2025-09-24 17:34:46
1794
原创 基因组视角下的地球生物群落:微生物研究综述
2017年,Woyke等人阐述了微生物单细胞测序的发展轨迹,该技术能够从复杂环境中分离单个微生物细胞并进行基因组测序,避免了传统培养方法的局限,为研究未培养微生物提供了有力工具。2024年,Agustinho等人和Kim等人分别综述了长读长测序技术在宏基因组研究中的应用,该技术可生成更长的DNA序列读数,提高了基因组组装的完整性和准确性,助力更精准地解析微生物基因组结构。总之,基因组中心方法为微生物研究带来了革命性的变化,极大地推动了我们对地球生物群系中微生物多样性、功能和进化的认识。
2025-09-24 17:34:01
1209
原创 用 MDSINE2 解析微生物组生态系统尺度动态变化|Nature Microbiology
MDSINE2是一种创新的微生物组动态建模工具,通过贝叶斯框架和广义Lotka-Volterra模型,解决了微生物组研究中的关键挑战。其核心创新包括:1)自动聚类微生物为功能模块,减少模型复杂度;2)整合多模态数据并建模噪声;3)量化生态系统稳定性和关键物种。研究团队通过高分辨率小鼠实验数据验证了工具性能,发现模块化网络结构和特异性扰动响应等生物学规律。MDSINE2提供Python包和命令行接口,支持从数据预处理到动态网络推断的全流程分析,为微生物组生态机制研究提供了强大工具。
2025-09-14 21:26:20
982
1
原创 使用 LexicMap 实现百万级原核生物基因组高效序列比对 | NBT
发表于《Nature Biotechnology》的这项研究,针对大规模基因组比对的核心痛点,设计了一套兼顾速度、内存与准确性的解决方案。研究团队通过优化序列草图生成、种子匹配与索引构建流程,开发出LexicMap工具,并在多个百万级基因组数据集上验证了其性能优势。
2025-09-14 21:14:29
1059
原创 土壤微生物组对极端气候事件的响应模式
2025年Nature环境微生物研究揭示土壤微生物对极端气候事件的响应模式。一项泛欧洲研究发现,干旱、洪水、冻结和高温等极端事件会引发微生物群落高度一致且系统发育保守的响应,其中高温显著降低多样性并诱导休眠机制。研究还发现微生物响应强度可通过土壤原生环境预测,为全球气候变化下的生态风险评估提供了新框架。该研究通过统一实验设计和多组学分析,建立了土壤微生物对极端气候冲击的普适响应模型。
2025-08-19 14:15:39
773
原创 功能机制定义土壤微生物组对环境变化的响应
土壤微生物组的代谢活动在全球养分循环中起着核心作用。理解土壤代谢活动如何响应气候驱动的环境扰动是一个关键挑战。然而,土壤的生态、空间和化学复杂性阻碍了本文对这些群落如何响应扰动的理解。微生物组代谢响应环境变化的机制问题,由于自然微生物组的复杂性而变得尤为困难。这种复杂性在土壤中表现得最为明显,土壤具有巨大的分类多样性、空间异质性和化学多样性环境。传统的大规模调查方法通过量化野外环境变化、群落组成和代谢过程之间的相关性来研究这个问题。
2025-08-05 11:00:57
1162
原创 北美河流微生物组功能数据库(GROWdb)
学习一些2025年最新的Nature环境微生物研究文章,了解一下当前较新的研究思路和方法。这篇文章跟上一篇那个类似,采样贡献很大,同时有数据资源性贡献。然后测了宏基因组+宏转录组(所以可以自信的说功能数据库),还提出了河流连续体概念(这种思想可以借鉴)。最终也是没有做验证实验发表在Nature上。
2025-08-05 10:56:44
1155
原创 冰川补给溪流中细菌微生物组的多样性和生物地理学
学习一些2025年最新的Nature环境微生物研究文章,了解一下当前发在顶刊的较新的研究思路和方法。
2025-07-31 16:13:28
813
原创 有关Rarefaction的探讨,一篇10年前的文章
这篇文章探讨了微生物组数据分析中常用的稀释(rarefying)方法的缺陷,并提出了使用更合适的统计模型。
2025-07-25 11:45:26
767
原创 预印本|MetaNet: a scalable and integrated tool for reproducible omics network analysis
MetaNet是一个用于组学网络分析的R包,提供了多种功能,包括网络构建、可视化、比较和稳定性分析等。最近我把MetaNet的预印本放到了bioRxiv上,欢迎大家阅读和使用。网络分析是揭示高通量组学数据集中复杂关系的有力策略。然而,现有工具通常在可扩展性、灵活性以及多组学整合的原生支持方面存在不足,这为探索复杂生物网络设置了重大障碍。为突破这些限制,我们开发了MetaNet——一个高性能R语言软件包,专为多组学数据集的生物网络构建、可视化与分析而设计。
2025-07-06 11:24:18
1217
原创 MaAsLin 3:微生物组多变量关联分析
MaAsLin 3是一个强大的微生物组多变量关联分析R包工具,提供了同时检测丰度和存在性关联的能力,并引入了创新的组成性校正方法。
2025-07-06 11:23:38
1679
原创 中介分析与结构方程模型(SEM)学习
中介分析是一种统计方法,用于研究自变量(X)通过一个或多个中介变量(M)影响因变量(Y)的机制。本文介绍了中介分析的基本概念和R语言中的实现方法,并探讨了结构方程模型(SEM)的应用。
2025-06-27 09:57:19
2593
原创 在低生物量微生物组研究中预防和报告污染|Nature Microbiology指南
我们实验室经常处理低微生物生物量样本(如宿主相关的呼吸道,阴道等微生物组,或是环境相关的沙子,冻土等微生物组),最近看到Nature Microbiology发表了一篇关于低微生物生物量样本污染的指南。
2025-06-27 01:13:28
1491
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅