
hadoop
weixin_45086773
这个作者很懒,什么都没留下…
展开
-
SQL计算留存率等指标
一、问题1:留存率计算 字段及表说明: 表名:user_log 字段名: log_day:登录日期 device_id:用户设备id app_id:用户app的id,其中device_id和app_id确定唯一的用户 1.1计算某日留存率(次日、3日、7日、30日) --计算次日、3日、7日、30日留存率 select log_day,count(user_id_d1)/count(user_id...转载 2020-01-05 23:47:46 · 2314 阅读 · 0 评论 -
hive分组排序groupby,order by,Sort By,DISTRIBUTE BY, CLUSTER BY
groupby GROUP BY语句通常会和聚合函数一起使用,按照一个或者多个列队结果进行分组,然后对每个组执行聚合操作 案例实操: 计算每个学生的平均分数 select s_id ,avg(s_score) from score group by s_id; 计算每个学生最高成绩 select s_id ,max(s_score) from score group by s_id; order...原创 2019-12-30 22:29:46 · 1696 阅读 · 0 评论 -
hive连接报错MetaException、metadata.HiveException
hive连接报错MetaException、metadata.HiveException、具体报错信息如下1. 检查 hive-site.xml2. 检查 mysql是否正常启动连接是否正常3. 检查 mysql是否正常启动连接是否正常4. 如果以上都没有出错,就启动一下命令5. 进入hive主目录然后启动hive6. 以上都没有错误之后,就OK了 具体报错信息如下 Exception ...原创 2019-09-07 19:50:53 · 2305 阅读 · 0 评论 -
kudu错误分析
kudu启动错误 第一个问题:报错日志如下 E0919 21:40:31.290339 18387 master.cc:189] Unable to init master catalog manager: Not found: Unable to initialize catalog manager: Failed to initialize sys tables async: Unable t...原创 2019-09-19 22:05:05 · 1758 阅读 · 0 评论