大数据 Apache Druid
文章平均质量分 76
翰林小院
翰林小院 – 记录是一种好习惯–QQ交流群:545713160
关注JAVA、Hadoop、Storm、Spark、Redis、Linux、大数据、分布式、架构、算法、性能调优、实战经验,记录工作中的点点滴滴,整理其中的干货知识。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【大数据专栏】大数据框架-Apache Druid Overview
Druid采用分布式云友好架构,支持独立配置和扩展服务,具有高容错性。其核心服务包括:Coordinator管理数据可用性,Overlord控制数据摄取,Broker处理查询,Router路由请求,Historical存储数据,MiddleManager/Peon负责数据摄取,Indexer作为可选任务执行系统。组件故障不会立即影响其他服务,确保系统稳定性。这种模块化设计提供了灵活的集群管理能力。原创 2025-09-05 15:02:21 · 812 阅读 · 0 评论 -
【大数据专栏】大数据框架-Apache Druid 架构说明
Apache Druid 是一个集时间序列数据库、数据仓库和全文检索系统特点于一体的分析性数据平台。可以从消息总线流式获取数据(如 Kafka,Amazon Kinesis),或从数据湖批量加载文件(如 HDFS,Amazon S3 和其他同类数据源)。Druid 为 Clickstream,APM(应用性能管理系统),supply chain(供应链),网络遥测,数字营销和其他事件驱动形式的场景解锁了新的查询方式和工作流。Druid 专为实时和历史数据的快速临时查询而构建。原创 2025-04-16 11:27:39 · 837 阅读 · 0 评论 -
【大数据专栏】大数据框架-部署Apache Druid
Coordinator 服务主要负责区段管理和分发。更具体地说, Coordinator 服务与 Historical 服务通信,以根据配置加载或删除 Segment。Coordinator 负责加载新 Segment、删除过时的 Segment、确保 Segment 被正确(配置)次数“复制”(即加载到多个不同的 Historical 节点上)以及移动 (“平衡”)段,以保持后者均匀加载。druid元数据存储在pgsql中。ZK负责集群状态和一致性。原创 2025-04-16 14:18:33 · 339 阅读 · 0 评论 -
【大数据专栏】大数据框架-Apache Druid 快速开始
至少需要一台6G的服务器,在此章节你将会1.部署一个Durid服务并启动服务2.使用SQL提取数据,并查询。原创 2025-04-16 14:43:10 · 232 阅读 · 0 评论
分享