分片系统的扩展与优化
1. 选择分片键的重要性及常见陷阱
在构建可扩展的系统时,选择合适的分片键至关重要。一旦选定分片键,通常就难以更改,因为分片键是不可变的。选择不当的分片键会严重影响插入和查询性能,甚至使分片的优势荡然无存。
在为电子表格应用程序选择分片键的过程中,会遇到以下三个主要陷阱:
- 热点问题(Hotspots) :某些分片键会导致所有读写操作都集中在单个分片的单个块上,使该分片不堪重负,而其他分片则闲置。
- 不可拆分块问题(Unsplittable chunks) :过于粗粒度的分片键会使许多文档具有相同的分片键,导致这些文档无法拆分为单独的块,限制了MongoDB均匀分布数据的能力。
- 定位不佳问题(Poor targeting) :如果分片键与查询没有关联,即使写入操作在集群中分布均匀,查询性能也会很差。
2. 具体分片键分析
2.1 以 _id 作为分片键
最初, _id 字段似乎是一个很好的分片键候选,因为每个文档都必须有 _id 字段,且默认有索引,很多查询中也会用到它,它由MongoDB使用BSON Object ID类型自动生成,本质上是一个全局唯一标识符(GUID)。
然而,使用Object ID作为分片键存在一个明显问题:其值是严格递增的。这意味着每个新文档的分片键都比集合中的其他文档大,所有新文档都会被写入到同一个块中,导致所有写入操作都集中在
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



