-
Overview
分区是对数据库进行深入了解的关键入口。
ddb是为OLAP设计的系统,主要是解决:
- 海量结构化数据的快速存储和计算;
- 通过内存数据库和流数据计算引擎实现高性能数据处理
ddb不适合数据频繁更改的OLTP;
-
什么是好的分区策略
一个好的分区策略通过只读取查询所需的相关数据来减少要扫描的数据量。
-
怎么叫所谓“不好”
如果分区机制设计不合理,对数据库的查询、计算以及其它操作都可能受到“磁盘访问I/O”这个瓶颈的限制。
-
磁盘访问I/O
-
DDB的架构
不同于其他分布式数据库采用的MPP架构,DolphinDB架构中没有leader node与computing nodes的区分,而是点对点结构,每个客户端可以连接到任何一个数据节点。
-
关于分区
不能用不同的分区类型或分区方案覆盖已有的分布式数据库。
分区类型partitionType:定义的几种类型
分区方案partitionScheme:具体的分区内容
partitionType partitionScheme HASH database(“dfs://hashdb”, HASH, [INT, 2]) 产生指定数量分区 RANGE database(“dfs://rangedb”, RANGE, 0 5 10) 具体值的连续扩展;包含起始不含结尾 VALUE database(“dfs://valuedb”, VALUE, 2000.01M…2016.12M) 具体