大数据与大规模基因组研究:机遇与伦理挑战
1. 大数据时代的来临
在过去几年里,我们收集和共享信息的技术能力有了巨大的发展。这使得大量数据的收集、分发和分析成为可能,这种大规模的数据收集被称为“大数据”。美国国家科学基金会将其定义为“大型、多样、复杂、纵向和/或分布式的数据集,这些数据集来自仪器、传感器、互联网交易、电子邮件、视频、点击流以及现在和未来所有其他数字来源”。
大数据在许多领域都有应用,在生物医学研究领域的潜力尤为令人兴奋。通过创建大数据健康存储库,研究人员可以从众多临床和研究来源收集信息,极大地扩展了数据的广度,并能与其他研究人员更广泛地共享信息。这使研究人员能够以全新的方式研究疾病,有望更快地取得进展。大数据还能通过将复杂工作分散到多个调查地点,实现更高效的数据分析。此外,通过聚合不同调查地点的数据,研究人员可以解决以前难以研究的挑战性或罕见健康问题。
2. 大规模基因组存储库(LSGRs)的潜力
2.1 基因组研究与大数据的契合
所有科学研究都会产生数据,但基因组分析具有独特性,因为它天生会产生大量数据。每个人类基因组大约包含20,000 - 25,000个基因,每个基因由超过三百万个碱基对组成,即使是最常规的基因组测序或图谱绘制也会产生大量数据。由于大多数研究涉及多个个体,每个个体都有独特的基因组,对群体基因组进行测序会产生海量数据供研究人员分析。
LSGRs不仅是组织和整理基因研究的有用工具,基因组研究与大数据天然契合。基于基因的疗法和研究具有复杂性,需要研究和比较多个个体的基因组。对于常见疾病,一系列基因组变异可能影响个体患特定疾病或出现特定健康结果的风险。为了找到这些变异,研究人员必须研
超级会员免费看
订阅专栏 解锁全文
786

被折叠的 条评论
为什么被折叠?



