- 快速识别已知和新兴的传染性病毒对于及时采取治疗措施、预测疾病进展以及应对暴发或流行至关重要。2019年新冠疫情(COVID-19)和近期猴痘疫情凸显出现有监测手段在快速发现未知病毒方面的不足。未来可能还会有其他病毒出现并需要迅速控制。传统病毒检测方法包括核酸扩增检测(如PCR)和免疫学检测,但这些方法通常针对已知病毒设计,对新发或变异病毒可能无法及时反应。病毒培养虽然耗时,但作为一种非特异性方法,可用于富集样本中的感染性病毒,随后通过观察细胞病变效应等判断病毒存在。近年来,鸟枪法蛋白质组学(shotgun proteomics)作为一种新兴技术被证明可用于复杂混合物中病毒的鉴定。鸟枪法蛋白质组学利用液相色谱串联质谱(LC-MS/MS)分析蛋白质水解产生的肽段,将获得的质谱数据与蛋白质序列数据库比对,从而鉴定样本中存在的蛋白质及其来源。研究表明,这种基于质谱的蛋白质组学方法有望成为病毒检测和鉴定的补充手段。然而,要将其应用于实际检测,需要解决数据解读的挑战,例如病毒数据库序列冗余、不同病毒或宿主蛋白间肽段序列相似等问题,这些都会影响病毒的快速明确鉴定。在此背景下,荷兰等国的研究团队开发了P4PP(Proteome for Pandemic Preparedness)平台,旨在利用鸟枪法蛋白质组学实现对广泛病毒的非靶向、高通量检测,提升对新发或变异病毒的早期识别能力。

一、P4PP研究方法
P4PP是一种基于鸟枪法蛋白质组学的病毒鉴定分析流程,包括定制的数据库和网络应用程序。其核心方法如下:首先,构建了一个包含1896种病毒(涵盖32个病毒科)的蛋白质序列数据库(P4PP v01),这些病毒均至少有1种可感染人类的成员。数据库涵盖了各病毒种的主要蛋白序列,包括同一病毒的不同株系和变异株信息,以便能够区分病毒亚型。随后,将待测样品进行蛋白质提取和胰蛋白酶酶解,产生肽段混合物;利用LC-MS/MS对肽段进行分离和串联质谱分析,获得肽段的碎片离子谱图。将这些谱图与P4PP数据库进行比对检索,鉴定出匹配的肽段序列。P4PP分析流程对鉴定到的肽段进行筛选,仅保留高度可信的肽段(错误发现率FDR≤0.1%)用于后续病毒判别。接着,通过独特的算法对肽段数据进行分析,判断样本中存在的病毒种类:首先在科水平进行筛选,要求每个病毒科至少有3条科特异性的肽段匹配;然后在科内进行种水平鉴定,选择匹配到最多且不少于3条种特异性肽段的病毒种作为结果。这一算法确保了鉴定结果的可靠性和特异性。此外,P4PP还针对流感病毒和新冠病毒等开发了亚型/变异株分型功能,通过比对病毒蛋白序列差异,对这些病毒进行亚型或谱系的细分鉴定。整个分析流程通过网络应用程序实现,用户只需上传质谱数据或鉴定到的肽段列表,即可在线获得病毒鉴定报告。P4PP的设计强调易用性和普适性:分析过程自动完成,无需用户具备深厚的生物信息学背景;同时该流程不依赖于病毒的核酸类型(DNA或RNA)或特定引物/抗体,可同时检测多种病毒而无需预先假定病毒种类。

二、研究结果
研究对P4PP方法进行了系统的开发和验证:
- 数据库构建:基于国际病毒分类委员会(ICTV)的病毒分类和NCBI等数据库的蛋白序列,构建了包含1896种人类相关病毒的蛋白质序列库。该库覆盖了常见及潜在的人类致病病毒种,包括不同病毒科的代表成员,并针对流感病毒和SARS-CoV-2等包含了大量株系序列,以支持亚型和变异株的区分。
- 算法与软件:开发了配套的P4PP分析算法和网络应用,实现从肽段鉴定结果到病毒识别的自动化分析。算法通过科-种两级筛选,提高了病毒鉴定的特异性和准确性。P4PP应用可在网页端运行,提供直观的结果报告,包括检测到的病毒及其肽段证据等。
- 方法验证:利用9个不同来源的质谱数据集对P4PP进行验证,涵盖来自6个实验室、使用6种不同样本处理流程和9种不同质谱仪器获得的数据。这些数据集包含174份病毒培养上清样品(涉及21种病毒、9个病毒科)以及14份未感染细胞对照样品。通过P4PP分析,在160份病毒感染样品中,146份被正确鉴定到病毒种水平,另有4份鉴定到病毒科水平。

使用P4PP分析样品
结果显示,P4PP对大多数病毒样本能够给出准确的种或科水平鉴定。10份未检测到病毒的样本均为感染初期或低感染复数(MOI)的样品,病毒蛋白丰度较低,后续同一批次的晚期样本中均成功检测到病毒,说明这些样本的初始肽段信号低于检测限。在14份未感染对照中,除1份因实验交叉污染而错误检测到本底病毒外,其余均未出现假阳性结果。进一步分析表明,P4PP不仅能鉴定病毒种类,在病毒蛋白丰度足够时还可对某些病毒进行亚型/变异株分型。例如,对于流感A病毒的不同亚型(H1N1、H3N2、H5N1等)以及新冠病毒(SARS-CoV-2)的不同变异株(Alpha、Beta、Gamma、Delta等),P4PP均能根据特异性肽段将其区分开。这些结果验证了P4PP方法的广谱性和准确性:它能够在多种实验条件下可靠地检测和鉴定多种病毒,包括新发病毒株。

肽鉴定数量和不同样品浓度的分布
三、总结
P4PP技术是病毒学和蛋白质组学交叉领域的一项重大突破,其核心价值在于提供了一种非靶向、广谱的病毒识别方案。通过创新的鸟枪法蛋白质组学应用,P4PP摆脱了传统检测方法对特定引物或抗体的依赖,能够一次性筛查近1900种病毒,从而有效应对未知、新发或变异病毒带来的挑战。其创新意义不仅在于构建了大规模、可更新的病毒蛋白数据库,更在于将复杂的质谱数据分析流程封装为用户友好的网络平台,极大地降低了技术门槛,使先进的蛋白质组学技术得以在更广泛的实验室中应用。展望未来,P4PP在临床疑难感染诊断和公共卫生监测领域潜力巨大。它不仅能作为临床诊断的有力补充,更重要的是,能够成为全球传染病早期预警系统的关键一环,通过对环境或临床样本的常规监测,及时发现潜在的病毒威胁,为全球应对未来可能出现的疫情提供宝贵的准备时间。因此,P4PP的推广和应用将显著提升全球公共卫生体系的应急响应和疾病防控能力。
文献原文:Paauw A, Levin E, Voskamp-Visser IAI, et al. P4PP: A Universal Shotgun Proteomics Data Analysis Pipeline for Virus Identification. Mol Cell Proteomics. Published online May 29, 2025. doi:10.1016/j.mcpro.2025.101004

被折叠的 条评论
为什么被折叠?



