背景
笔者最近一段时间使用 Apache Pinot 比较多,发现目前国内使用 Pinot 的很少,所以跟他相关的资料也比较少,本人在扩容,升级,部署,查询等方面操作有些许经验,知道其中有很多细节需要注意和规避,所以打算开个坑来写一下这块相关的实践内容和注意事项,方便自己回溯也方便使用Pinot 的人参考。 顺便以此来回馈 Pinot 社区对我很多的帮助,依稀记得 Pinot 作者之一 fuxiang 在国外跟我用腾讯会议沟通交流为什么升级 Controller 升级不上去的原因,非常感谢。
缘分
从国外空降了一个 Linkedin 的领导,或许跟他的职业经历有关,也或许跟他的爱好有关。他列出了使用 Pinot 的好处和使用 Clickhouse 的坏处,一番不算激烈的讨论,最终还是引入了 Pinot 用来做后续底层基础。
数据比对
| 要素/用法及其易用性 | ClickHouse | Pinot |
|---|---|---|
| kafka流数据输入 | 支持 | 支持 |
| Join | 支持 | 只能LookUp |
| cluster可伸缩 | 需要手动更改权值以让数据写入新节点,均衡后,再次修改权值以维护均衡 | 每增加一个节点到cluster,在控制台配置新节点,触发rebalance,pinot会自动调节所有表的数据分布 |
| 监控 | Prometheus + Grafana | Prometheus + Grafana | <

文章介绍了ApachePinot的使用经验和实践细节,包括扩容、升级、部署以及查询操作中的注意事项。作者强调Pinot在国内使用较少,资料有限,希望通过分享帮助其他用户。文章对比了Pinot与Clickhouse,并指出Pinot在数据输入、可伸缩性和监控方面的优势。Pinot的组件包括Controller、Broker和Server,各自承担元数据管理、查询处理和数据存储角色。工作流程涉及用户查询、Broker查询定位、Server数据读取及Broker结果汇总。后续内容将深入探讨各组件的内部功能和操作技巧。
最低0.47元/天 解锁文章
843

被折叠的 条评论
为什么被折叠?



