文档数据库的应用场景与产品选择
1. 处理多样化数据
在当今的应用中,常常需要整合组织内多个系统的数据,以及第三方或公共数据,以提供更灵活的应用。然而,外部数据的格式不受组织控制,且可能随时更改,同时很多数据结构会根据创建它们的应用程序而变化,例如推文,它背后有数百个字段,且因创建应用的不同而有所差异。
1.1 存储和检索可变信息
所有 NoSQL 文档数据库的一个关键优势是能够存储和检索可变信息,但对其结构进行索引和搜索却很困难。许多文档数据库本身不执行这些操作,而是使用外部搜索引擎,如 MongoDB 使用 Solr,Couchbase 使用 Elasticsearch。这些搜索引擎通常对文档中的文本或特定配置的元素进行索引。
1.2 特殊的索引方式
Microsoft 的 DocumentDB 和 MarkLogic Server 采用了不同的方法。它们有一个通用索引,在文档被摄入时对其进行检查,同时对结构和值进行索引。这使得在文档存储后即可执行元素值查询(精确匹配查询)。Microsoft 的实现甚至允许在这个通用索引上进行范围查询(小于、大于等),而 MarkLogic 服务器则需要单独配置范围索引。
不过,这种额外的索引是有代价的。如果要保持索引与数据一致,摄入时会花费额外的时间,并且索引也会占用存储空间,这可能会增加服务器和存储租赁成本。同时,这两者都允许对每个数据库(MarkLogic)或集合(Microsoft 的 DocumentDB,类似于数据库中管理一组文档的“桶”)的索引进行细粒度配置。
2. 管理随时间的变化
如果更改文档的格式,就需要重新配
文档数据库应用场景与选型
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



