NoSQL数据库管理系统的物理设计策略研究
1. 引言
在NoSQL数据库管理系统(DBMS)中,物理设计策略对于提高查询性能至关重要。本文将详细探讨一种针对NoSQL DBMS的物理设计策略,并通过实验研究验证其有效性。
2. 查询执行计划分析
以一个特定查询为例,Neo4j为该查询构建的执行计划包含以下操作符:
1. 对Tag节点进行扫描。
2. 对Tag、Message和Person节点进行三次过滤。
3. 对Tag和Message、Message和Person、Person和Message、Message和Comment进行四次扩展。
4. 对Tag名称进行排序操作。
5. 进行聚合操作,统计消息收到的点赞数和回复数。
6. 进行投影操作。
7. 取前100个结果。
在这种情况下,考虑到Tag名称是唯一键,根据相关准则创建了Tag名称的索引。由于Tag节点实例数量众多,扫描Tag节点成本高昂,因此该索引显著提高了查询性能。同样的准则也应用于查询BI 14。
3. 实验研究
3.1 实验设计
3.1.1 数据集
本研究使用合成数据集,由名为DATAGEN的数据生成器生成。DATAGEN基于社交网络方案生成数据,并从DBpedia提取部分数据,使数据具有现实性和相关性。生成的数据集中,帖子数据量最大,包含从DBpedia提取的文本数据。数据库模式包含居住在城市中的人,他们相互认识、发布消息并根据标签分类进行标记。人们还可以是论坛成员、在公司工作或在大学学习。模式中的节点度分布类似于幂律分布。
超级会员免费看
订阅专栏 解锁全文
5856

被折叠的 条评论
为什么被折叠?



