【Apache Pinot】Controller、Broker 和 Server 的概念和工作流程

最新推荐文章于 2024-11-05 18:23:17 发布

原创

最新推荐文章于 2024-11-05 18:23:17 发布 · 1k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#apache #olap #pinot

文章介绍了ApachePinot的使用经验和实践细节，包括扩容、升级、部署以及查询操作中的注意事项。作者强调Pinot在国内使用较少，资料有限，希望通过分享帮助其他用户。文章对比了Pinot与Clickhouse，并指出Pinot在数据输入、可伸缩性和监控方面的优势。Pinot的组件包括Controller、Broker和Server，各自承担元数据管理、查询处理和数据存储角色。工作流程涉及用户查询、Broker查询定位、Server数据读取及Broker结果汇总。后续内容将深入探讨各组件的内部功能和操作技巧。

背景

笔者最近一段时间使用 Apache Pinot 比较多，发现目前国内使用 Pinot 的很少，所以跟他相关的资料也比较少，本人在扩容，升级，部署，查询等方面操作有些许经验，知道其中有很多细节需要注意和规避，所以打算开个坑来写一下这块相关的实践内容和注意事项，方便自己回溯也方便使用Pinot 的人参考。顺便以此来回馈 Pinot 社区对我很多的帮助，依稀记得 Pinot 作者之一 fuxiang 在国外跟我用腾讯会议沟通交流为什么升级 Controller 升级不上去的原因，非常感谢。

缘分

从国外空降了一个 Linkedin 的领导，或许跟他的职业经历有关，也或许跟他的爱好有关。他列出了使用 Pinot 的好处和使用 Clickhouse 的坏处，一番不算激烈的讨论，最终还是引入了 Pinot 用来做后续底层基础。

数据比对

要素/用法及其易用性	ClickHouse	Pinot
kafka流数据输入	支持	支持
Join	支持	只能LookUp
cluster可伸缩	需要手动更改权值以让数据写入新节点，均衡后，再次修改权值以维护均衡	每增加一个节点到cluster，在控制台配置新节点，触发rebalance，pinot会自动调节所有表的数据分布
监控	Prometheus + Grafana	Prometheus + Grafana