大数据关于人类受试者的数据管理计划、机构审查委员会与伦理管理
1. 引言
美国国家科学基金会(2012 年)将大数据定义为“由仪器、传感器、互联网交易、电子邮件、视频、点击流以及/或者所有其他当前和未来可用的数字来源生成的大型、多样、复杂、纵向和/或分布式数据集”,更一般地说,是指数据的“三个 V”:体量(volume)、速度(velocity)和多样性(variety)。从伦理角度审视大数据,还发现了一些随着大量数据用于各种目的而逐渐显现的特征,我们将其标记为“4R”,即再利用(reuse)、重新定位用途(repurposing)、重新组合(recombination)和重新分析(reanalysis)。在任何特定情况下,这些特征的任何子集可能单独出现,也可能共同出现。
这“4R”解释了为什么隐私保护与信息保护有重叠,但又相互区别。同时,它们也引发了这样一种可能性,即特定大数据集的伦理来源和伦理视野超越了其最初收集时的狭隘环境。鉴于《贝尔蒙报告》以及《通用规则》下科学研究中对人类受试者保护的重要性,“4R”对从事人类事务大数据研究的科学家的长期义务提出了疑问,而这些疑问可能不适用于政府或商业组织。
接下来,我们将通过一系列步骤来探讨这些观点。首先,解释“4R”以及相关的伦理视野和伦理来源概念。其次,提供一套决策树,帮助研究人员在撰写使用大数据进行人类受试者联邦研究资助提案时,特别是针对美国国家科学基金会的提案,制定数据管理计划(DMP)。最后,通过探讨几个体现“4R”的大数据人类受试者研究案例,展示如何使用 DMP 决策树。在这些案例分析中,我们还将探讨整个分析对《通用规则》拟议规则制定通知的影响,以及对《通用规则》组织中机构审查委员会(IRBs)工作的影响。
超级会员免费看
订阅专栏 解锁全文
1269

被折叠的 条评论
为什么被折叠?



