电子表格与银行架构的信息处理探索
1. 电子表格相关研究
在数据管理中,电子表格的一个基本特征是模式(schema)和实例(instances)的分离。模式通常位于表格的上方(q↑)或左侧(q ←),而实例则在下方(q↓)或右侧(q →)。众多相关研究旨在识别电子表格的隐式模式。
- 实体每行法 :Han等人采用了一种简单的方法来设计模式和实例,即实体每行法(entity - per - row)。在这种方法中,除了模式外,表格的每一行应描述一个不同的实体,每一列对应该实体的一个属性。例如,每列可以是日期、属、种等属性,每行代表一个事件,如标本的收集。用户首先要指定一个单元格,其所在列包含一个充当标识符的字段,类似于数据库的主键。
- 灵活映射解决方案 :Langegger和Wob提出了一种类似但更灵活的解决方案,用于在实体每行组织中映射电子表格。他们能够处理字段之间的层次结构,当一个字段被划分为子字段时,例如日期、纬度和经度字段,它们分别表示物种收集的时间和地点。通常作者会在这些列上方创建一个跨越整个范围的标签,如“字段编号”,以表明这些字段是更大字段的细分。
- RDF与相关查询语言 :RDF作为一种开放标准,支持语法和语义互操作性,被广泛用作集成多个电子表格数据的输出格式。Langegger和WOB建议通过SPARQL(一种用于RDF的查询语言)访问这些数据,Oconnor等人则使用OWL提出了类似的解决方案。
- 电子表格生命周期 :Abraham和Erwig观察到电子表格
超级会员免费看
订阅专栏 解锁全文
37

被折叠的 条评论
为什么被折叠?



