数据量
- 百万级 MySQL、PostgreSQL
- 百万-百亿级 分析性数据仓库:Impala、Presto、GreenPlum、Apache Drill
- 百亿级 离线数据仓库:hive、spark
系统架构
- SMP(Symmetric Multi-Processor 对称多处理器架构) 服务器所有CPU都是对等的,无主次或从属关系,共享同一物理内存。 日常的PC、笔记本、手机都是SMP架构。 扩展的方式包括增加内存、使用更快的CPU、增加CPU 缺点:由于系统中所有资源共享,因此扩展能力有限,最受限的是内存。随着CPU数量的增加, 内存访问冲突增加,导致CPU资源的浪费。2-4个CPU比较适合SMP架构
- NUMA(Non-Uniform Memory Access 非一致存储访问架构) 具有多个CPU模块,每个模块由多个CPU组成,并且具有独立的本地内存,I/O槽口等。 节点间通过互联模块通信,每个CPU可访问整个系统内存。访问本地内存速度远高于 访问远地内存,因此需要尽量减少不同CPU模块间的信息交互。
- MPP(Massive Parallel Processing 大规模并行处理架构) 由多个SMP服务器通过一定的节点互联网络进行连接,每个节点只访问自己的本地资源, 是一种完全无共享的结构,扩展能力好。