
hive
一只很酸de橘子
这个作者很懒,什么都没留下…
展开
-
Hive 调度任务报错FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask
最近调度任务出现这样的问题,谷歌一下,多数是说mapreduce的内存溢出,但是数据量只有不到两万,感觉这个应该能承受,后来无意间看到字段类型的对应,发现有几个字段类型有明显错误,比如本应日期类型的字段,表结构设置成了decimal,(最初表不是我建的,不清楚,这不是帅锅!),后来改了字段类型(附命令:ALTER TABLE 表名 CHANGE 旧字段 新字段 类型;),在执行,成功插入数据。...原创 2020-06-09 10:33:31 · 1391 阅读 · 0 评论 -
hive使用nvl()函数报NullPointerException null错误
hive 不支持nvl(),但是可以用Coalesce函数原创 2020-05-27 11:54:02 · 1407 阅读 · 2 评论 -
hive:导出数据记录中null被替换为\n的解决方案
1)设置 alter table name SET SERDEPROPERTIES('serialization.null.format' = '\N');则:底层数据保存的是'\N',通过查询显示的是'NULL'这时如果查询为空值的字段可通过 语句:a is null 或者 a='\\N'2)设置 alter tablename SET SERDEPROPERTIES('serialization.null.format' = 'NULL');则:底层数据保存的是'NULL',通过查询显示的.原创 2020-05-21 17:57:11 · 1326 阅读 · 0 评论 -
hive时间日期函数
-- 1、hive取得当前日期时间:-- 1.1) 取得当前日期:select current_date();-- 1.2) 取得当前日期时间:select current_timestamp();-- 1.3) hive取得当前时间戳:select unix_timestamp();-- 1.4) 时间戳转日期:select from_unixtime(1517725479,'yyyy-MM-dd HH:dd:ss');-- 1.5) 日期转unix时间戳:select t.原创 2020-05-20 16:24:21 · 2007 阅读 · 0 评论 -
hive行转列
数据集session_id row_number sku_id aa 2 a aa 3 c aa 1 b bb 2 d bb 3 c bb 1 a bb 4 a 根据session_id分组,将sku_id按照row_number的顺序,多行拼接成一行。se...原创 2020-04-28 16:34:45 · 126 阅读 · 0 评论 -
关于hive表中插入数据同一字段部分值为空问题
问题描述:从一个表取数插入备份表,同一个字段,有的正常,有的为空。查了很多方面,数据没问题,表没问题,字段类型没问题,总之就是各种没问题,很不解。后来把有问题的数据导出文件,发现一个共同特点:有问题的那个字段内容都是中文,这不是重点,重点是都有“,”分割,于是取看了目标表的表结构,发现也是用“,”做分割符,问题解决,分割符冲突。这种问题一般是很难发现的,建议建hive表的时候,用一些特...原创 2019-12-10 09:23:26 · 1575 阅读 · 0 评论