Druid 是一个开源的专为事件数据的 OLAP 查询设计的数据存储系统。Druid 用于大数据实时查询和分析的高容错、高性能开源分布式系统,旨在快速处理大规模的数据,并能够实现快速查询和分析。
Druid 具有以下主要特征:
-
为分析而设计——Druid 是为 OLAP 工作流的探索性分析而构建,它支持各种过滤、聚合和查询等类;
-
快速的交互式查询——Druid 的低延迟数据摄取架构允许事件在它们创建后毫秒内可被查询到;
-
高可用性——Druid 的数据在系统更新时依然可用,规模的扩大和缩小都不会造成数据丢失;
-
可扩展——Druid 已实现每天能够处理数十亿事件和 TB 级数据。
说到这有点像flink和system storage service的结合体,druid支持亚秒级的相应查询,可以理解为实时的OLAP系统,维度一定的条件下,数据量越大,它越有优势。
以上摘抄自网络,出处众多具体不详 :) 下面开始进入正题
使用druid.io的查询方式有四种
- 通过http api的方式,官方主推的,最多的一种方式,(但是有学习成本在里面,文档不跟着过一遍,会不知道怎么写查询json)。
- implydata的druid-client ,碍于太小众中的另类,凉了