
HIve
幸运的Alina
这个作者很懒,什么都没留下…
展开
-
解决在Hive建表时root用户对HDFS无权限问题
在使用pyspark 将DataFrame的数据插入到HIve中时,遇到了root账号无法insert数据到hive中,报错信息如下: org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.AccessControlException): Permission denied: user=root, access=WRIT...原创 2019-07-02 11:37:22 · 5087 阅读 · 0 评论 -
HIVE与HDFS进行数据导入导出操作
1. 将HDFS文件导入到HIVE中 1.1 创建内部表 create table result(user_id int ,product_id int ,rating float) commend "save user information" row format delimited fields terminated by ',' ; load data inpath "/ha...原创 2019-07-24 16:53:51 · 5703 阅读 · 0 评论 -
HIVE实现count分组统计后提取分组列中的TOP1
背景,有一个需求就是有一张用户办理产品渠道表,表中的数据字段如下 用户ID 产品ID 渠道 ID 然后需要统计不同的产品ID下面哪一个渠道ID对应的用户数最多,把最大的那个渠道ID找出来和产品ID一一对应上。 在这个需求上使用了HIVE的开窗函数来实现,具体实现SQL语句如下 select pro_id,qudao_code from (select pro_id,qud...原创 2019-08-06 09:16:56 · 5402 阅读 · 2 评论