信息网络上的OLAP与单纯形和细胞网格的空间索引
信息网络上的OLAP
在书目数据分析的背景下,将联机分析处理(OLAP)技术与信息网络相结合具有重要意义。我们需要同时分析节点的属性以及节点之间的链接,还要分析网络(如作者、出版物)随时间的动态变化,例如每年最热门的主题。为了创建新的OLAP工具,计划将数据挖掘方法和OLAP操作符相结合。
然而,实现这一框架面临着几个挑战:
1. 网络构建与知识提取 :需要从数据库中提取并构建多个网络,并从网络中提取知识以丰富网络。这需要考虑现有的算法和数据挖掘技术。
2. 多网络和知识存储模型设计 :传统模型可能无法满足需求,可能需要发明新的模型。
3. ETL步骤 :需要考虑如何对网络和知识进行ETL处理。
4. 分析工具提供 :需要为用户开发创新的工具来处理各种考虑的网络。
为了分析书目数据,提出了一个初步框架,主要思路如下:
1. 构建网络 :从书目数据库(如DBLP、ACM等)构建各种网络,包括合作作者网络、引用网络、主题网络、会议网络等。
2. 构建数据仓库 :使用合适的模型构建数据仓库来探索这些信息。
3. 应用数据挖掘技术 :应用数据挖掘技术来丰富信息,例如检测社区以丰富数据仓库的维度层次结构。
4. 开发可视化工具 :开发受OLAP导航过程启发的工具来