工作日交易数据的闪电快速分析

本文分享了构建事务性数据的高可伸缩多租户分析服务的经验,涵盖业务需求、架构设计、Spark技术应用及Prism查询引擎内部实现。深入探讨SparkSQL、DataFrames和Catalyst编译器特性,解决复杂管道和查询问题,优化交互式用户体验。

在本文中,我们将分享在为事务性数据构建高度可伸缩的多租户分析服务时所吸取的教训。我们将从大局和业务需求开始。然后描述具有用于数据准备、发布和查询引擎的批处理和交互式模块的体系结构,并注意相关的Spark技术。然后我们将深入Prism查询引擎的内部,重点介绍所使用的Spark SQL、DataFrames和Catalyst编译器特性。我们将描述在编译和执行复杂管道和查询时遇到的问题,以及如何使用缓存、采样和查询编译技术来支持交互式用户体验。 资源分享www.slidestalk.com/s/Lightning…

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值