
hive
文章平均质量分 51
Hive是基于Hadoop的数据仓库工具,它能够将结构化和半结构化数据转换成以Hadoop HDFS为存储平台的表格形式进行数据处理。这个专栏将致力于让读者快速掌握Hive分布式数据仓库技术,包括HiveQL查询语言、数据类型、数据表达式、文件格式等方面的知识。
阿年、嗯啊
做自己喜欢的事,品自己喜欢的茶,活成自己渴望的模样。
不骄不躁,认真做事,清楚做人,希望付出不会被辜负
展开
-
MySQL和Hive中的行转列、列转行
对比MySQL和Hive中的行转列、列转行方法,其中Hive列转行有两种方法,一种侧窗、一种union原创 2025-01-04 13:53:43 · 658 阅读 · 0 评论 -
Hive拉链表设计、实现、总结
拉链表的设计思路,如何制作,实践踩坑......原创 2024-02-16 18:33:32 · 1840 阅读 · 0 评论 -
Exception when loading 2 in table dim_user_zip with loadPath=hdfs://hadoop101:8020/......
Error while processing statement: FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.MoveTask. Exception when loading 2 in table dim_user_zip with loadPath=hdfs://hadoop101:8020/warehouse/gmall/dim/dim_user_zip/.hive-staging_hive_20原创 2024-02-16 10:00:00 · 728 阅读 · 0 评论 -
Hive中的复杂数据类型 - array、map、struct
Hive中的复杂数据类型,学会如何使用,如何指定字段为struct类型?如何向struct类型的字段中插入数据?如何取出struct字段中的值?原创 2024-02-14 12:56:48 · 2112 阅读 · 0 评论 -
HQL - 分析用户会话行为轨迹
分析用户每个会话的行为轨迹原创 2024-01-29 11:43:11 · 625 阅读 · 1 评论 -
Directory hdfs://hadoop101:8020/warehouse/xxx/dt=2021-01-03 could not be cleaned up.
向Hive分区表中load数据报错:FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.MoveTask. Directory hdfs://hadoop101:8020/warehouse/gmall/ods/ods_order_info/dt=2021-01-03 could not be cleaned up.可能是手动删除数据导致元数据没有被删除,所以再次load数据报错,解决办法是将表删除再重新创建原创 2023-06-03 20:21:55 · 489 阅读 · 0 评论 -
HQL - 用户注册、登录、下单综合统计
year()函数的使用 - 获取日期的年份原创 2023-05-08 20:54:37 · 149 阅读 · 1 评论 -
HQL - 查询销售件数高于品类平均数的商品
cast(a as int ),hive中数据类型的转换原创 2023-05-07 20:50:50 · 189 阅读 · 0 评论 -
HQL- 统计每个商品的销量最高的日期
先以sku_id和create_date分组,然后求sum(sku_num),求出一天的销量然后以销量倒序排序,进行编号,取最高的,也就是目标行。原创 2023-05-05 14:01:38 · 247 阅读 · 1 评论 -
HQL - 查询每天的新增用户数
date_format()、substring()函数切割时间,求每日新增用户数的思路原创 2023-05-04 22:24:51 · 286 阅读 · 0 评论 -
HQL - 筛选去年总销量小于100的商品
substring()、date_add()、datediff()原创 2023-05-03 14:19:58 · 117 阅读 · 0 评论 -
HQL - 每个商品销售首年的年份、销售数量和销售金额
substring()、dense_rank()、over()原创 2023-05-02 11:19:39 · 171 阅读 · 0 评论 -
HQL - 查询首次下单后第二天连续下单的用户比率
lead()、date()、datediff()、concat()函数的使用,嵌套子查询的优化with a as()原创 2023-05-01 16:26:02 · 735 阅读 · 1 评论 -
【HQL - 查询用户的累计消费金额及VIP等级】
查询用户的累计消费金额及VIP等级,rows between unbounded preceding and current row;case when 分类原创 2023-04-30 13:45:36 · 1250 阅读 · 1 评论 -
【HQL - 查询各品类销售商品的种类数及销量最高的商品】
查询各品类销售商品的种类数及销量最高的商品原创 2023-04-29 15:20:22 · 554 阅读 · 0 评论 -
【HQL - 查询至少连续三天下单的用户】
查询至少连续三天下单的用户,date_sub()、row_number()原创 2023-04-28 17:34:54 · 554 阅读 · 0 评论 -
【HQL - 查询累积销量排名第二的商品】
查询累计销量排名第二的商品,dense_rank()、nullif()、over()函数的使用原创 2023-04-28 17:08:34 · 354 阅读 · 0 评论 -
Hive常用函数案例实操
hive常用函数案例实操原创 2022-10-24 13:09:10 · 1086 阅读 · 1 评论 -
Hive求连续几天的问题
冷静的分析,清晰的解题思路,教你学会用Hive求连续几天登录/消费 之类的问题原创 2022-08-17 13:28:49 · 862 阅读 · 1 评论 -
初识Hive之Hive的基本操作命令
查看数据库: show databases;创建数据库: create database [if not exists] test01; create database test02 comment 'this is a database' location '/myCreateDatabase/';其中方括号中的内容为可选项,意思是:如果不存在数据库test01则创建。第二条创建语句comment选项后指定的是该数据库的备注信息,原生的hive不支持中文,想要支持中文要修..原创 2021-04-12 19:19:33 · 516 阅读 · 0 评论 -
Hive本地模式安装 schematool -initSchema -dbType mysql初始MySQL数据库报错-Access denied for user ‘root‘@‘
初始化报错的异常信息:[root@master conf]# schematool -initSchema -dbType mysqlSLF4J: Class path contains multiple SLF4J bindings.SLF4J: Found binding in [jar:file:/export/servers/hive/lib/log4j-slf4j-impl-2.6.2.jar!/org/slf4j/impl/StaticLoggerBinder.class]SLF4J:原创 2021-04-12 19:10:06 · 1829 阅读 · 0 评论