公民科学数据的FAIR化:通过元数据驱动的Web API开发
一、引言
如今,科学民主化的趋势逐渐兴起,公民科学(Citizen Science,CS)应运而生。公民科学是一个鼓励公民参与数据收集的协作过程,在分析和监测自然、经济或社会过程的数据生产中发挥着关键作用。数以百万计的志愿者通过观察和传感器为研究数据的增长做出了贡献。
公民科学产生的数据通常由公民科学平台托管,这些平台是包含多个公民科学项目数据的基于网络的门户。根据公民科学的十项原则,公民科学项目的数据和元数据应公开可用,结果应尽可能以开放获取的格式发布。因此,公民科学数据应遵循FAIR原则,即数据应具备可发现性(Findability)、可访问性(Accessibility)、可互操作性(Interoperability)和可重用性(Reusability)。
然而,大多数公民科学平台,如Scistarter和Zooniverse,通常不遵循FAIR原则。在可发现性方面,很难找到包含公民科学数据的项目;在可访问性方面,数据消费者难以获取数据,通常需要下载整个数据集;在可互操作性方面,公民科学元数据通常以定制格式发布,限制了其互操作性;在可重用性方面,平台通常不提供Web API等解决方案来促进数据的重用。此外,虽然许多平台采用了PPSR - Core元数据标准,但该标准并未考虑FAIR原则,且DCAT(W3C数据目录词汇表)在公民科学平台中也未得到广泛采用。
因此,本文旨在通过将公民科学平台的元数据映射到DCAT,并提供Web API来实现公民科学数据的FAIR化,提高数据的可发现性和可重用性。
二、相关工作
公民科学平台是公民科学项目的发现点,主要有商
超级会员免费看
订阅专栏 解锁全文
1131

被折叠的 条评论
为什么被折叠?



