大数据 Apache Druid_翰林小院的博客-优快云博客

大数据 Apache Druid

关注

文章平均质量分 76

关注数：文章数：4 文章阅读量：2220 文章收藏量：15

作者: 翰林小院

翰林小院 – 记录是一种好习惯–QQ交流群:545713160 关注JAVA、Hadoop、Storm、Spark、Redis、Linux、大数据、分布式、架构、算法、性能调优、实战经验,记录工作中的点点滴滴,整理其中的干货知识。

展开

专栏收录文章

【大数据专栏】大数据框架-Apache Druid Overview

Druid采用分布式云友好架构，支持独立配置和扩展服务，具有高容错性。其核心服务包括：Coordinator管理数据可用性，Overlord控制数据摄取，Broker处理查询，Router路由请求，Historical存储数据，MiddleManager/Peon负责数据摄取，Indexer作为可选任务执行系统。组件故障不会立即影响其他服务，确保系统稳定性。这种模块化设计提供了灵活的集群管理能力。

原创 2025-09-05 15:02:21 · 812 阅读 · 0 评论
【大数据专栏】大数据框架-Apache Druid 架构说明

Apache Druid 是一个集时间序列数据库、数据仓库和全文检索系统特点于一体的分析性数据平台。可以从消息总线流式获取数据（如 Kafka，Amazon Kinesis），或从数据湖批量加载文件（如 HDFS，Amazon S3 和其他同类数据源）。Druid 为 Clickstream，APM(应用性能管理系统)，supply chain(供应链)，网络遥测，数字营销和其他事件驱动形式的场景解锁了新的查询方式和工作流。Druid 专为实时和历史数据的快速临时查询而构建。

原创 2025-04-16 11:27:39 · 837 阅读 · 0 评论
【大数据专栏】大数据框架-部署Apache Druid

Coordinator 服务主要负责区段管理和分发。更具体地说， Coordinator 服务与 Historical 服务通信，以根据配置加载或删除 Segment。Coordinator 负责加载新 Segment、删除过时的 Segment、确保 Segment 被正确（配置）次数“复制”（即加载到多个不同的 Historical 节点上）以及移动（“平衡”）段，以保持后者均匀加载。druid元数据存储在pgsql中。ZK负责集群状态和一致性。

原创 2025-04-16 14:18:33 · 339 阅读 · 0 评论
【大数据专栏】大数据框架-Apache Druid 快速开始

至少需要一台6G的服务器，在此章节你将会1.部署一个Durid服务并启动服务2.使用SQL提取数据，并查询。

原创 2025-04-16 14:43:10 · 232 阅读 · 0 评论

大数据 Apache Druid

作者: 翰林小院

【大数据专栏】大数据框架-Apache Druid Overview

【大数据专栏】大数据框架-Apache Druid 架构说明

【大数据专栏】大数据框架-部署Apache Druid

【大数据专栏】大数据框架-Apache Druid 快速开始