数据集的公开与复现
1. 引言
在科学研究和技术开发中,确保研究结果的可复现性是至关重要的。尤其是在Web工程和知识图谱领域,数据集的公开和复现保障措施显得尤为重要。本篇文章将深入探讨如何确保研究结果的可复现性,并详细介绍数据集公开的具体方法和保障措施。
2. 数据集的公开
为了让其他研究人员能够验证和进一步利用已有的研究成果,数据集应当尽可能地公开。公开数据集不仅有助于学术交流,还能促进技术进步和创新。以下是几种常用的数据集公开方式:
2.1 使用公共平台
- GitHub :GitHub 是一个广泛使用的代码托管平台,也可以用于托管数据集。用户可以通过创建仓库(repository)来上传和共享数据集。
- Zenodo :Zenodo 是一个免费的数据存储服务,支持多种文件格式和大小。它为每个上传的数据集分配一个DOI(数字对象标识符),确保数据集的永久性和可引用性。
- Figshare :Figshare 是另一个流行的数据存储平台,支持多种文件格式,允许用户轻松上传和分享数据集。
2.2 通过特定URL或数据仓库
- 特定URL :提供一个固定的URL链接,使用户可以直接访问数据集。例如,所有数据集和/或源代码均可在 http://touris
超级会员免费看
订阅专栏 解锁全文
538

被折叠的 条评论
为什么被折叠?



