代码位置
日志生成:https://github.com/SmallScorpion/gmall-mock.git
日志服务器:https://github.com/SmallScorpion/gmall-spark-ch-es-realtime.git
需求
按地区(用户性别、用户年龄段)统计当日新增付费用户首单平均消费
架构
在实时数仓中,通过将维表数据放入HBASE中达到查询以前用户状态(是否为首单),且通过其他为表数据可以得到需求的最终结果数据(用户性别、用户年龄段…)
HBase 建表
create table spark_ch_es_realtime_user_state( user_id varchar primary key ,state.if_consumed varchar ) SALT_BUCKETS = 3
pom
<!--hbase-->
<dependency>
<groupId>org.apache.phoenix</groupId>
<artifactId>phoenix-spark</artifactId>
<version>4.14.2-HBase-1.3</version>