生物多样性电子表格构建模式解读
1. 初始数据收集与分析
1.1 数据收集
- 分析从9份国际文凭组织(IB)的电子表格开始,从中识别出两种主要的构建模式,分别与电子表格的性质相关:对象目录(如博物馆中的标本)和与事件相关的电子表格(如实地采集样本的日志),后续将这两种电子表格性质简称为目录和事件。
- 为了进一步分析,又在网络上收集了33份电子表格,搜索时使用了与生物学领域相关的关键词作为筛选标准。
1.2 数据分类
为了处理不同类型电子表格之间的显著差异,将每个字段归类到六个探索性问题中(谁、什么、哪里、何时、为什么、如何)。这样做有助于在更高的抽象层面上表示和识别模式。例如,目录电子表格的初始字段通常是分类学鉴定(属于“什么”问题),而采集电子表格的初始字段则是日期和地点(分别属于“何时”和“哪里”问题)。
2. 假设提出
根据对这些电子表格的观察,提出了以下与模式相关的假设:
- H1 :大多数电子表格的组织遵循列作为字段、行作为记录的模式。
- H2 :大多数电子表格的组织遵循列作为字段、行作为记录的模式。
- H3 :电子表格的第一个字段通常定义其性质(如目录或事件)以及其构建模式。
基于这些假设,开发了一个名为SciSpread的系统,用于自动识别电子表格的模式。研究发现,这些模式能够推动在特定上下文中识别电子表格的性质,使其模式明确化,并支持语义注释。
超级会员免费看
订阅专栏 解锁全文
1890

被折叠的 条评论
为什么被折叠?



