
Big Data
文章平均质量分 59
loongshawn
钻进去,跳出来,多问题为什么,跳出能不能;学习要有深度,然后有广度,两者相辅相成。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【FAQ】HIVE解析JSON字符串-函数get_json_object
如何提前JSON属性针对json数组提取待处理数据[{"id": "123456789", "orgID": "group", "empName": "张三", "empID": "93002", "orgNamePath": "数据中心/高德地图/阿里巴巴"}]SQL写法SELECTget_json_object( regexp_replace( regexp_replace(field, '\\[', ''), '\\]', '' ) -- 提取json对象原创 2021-12-15 09:43:26 · 1688 阅读 · 0 评论 -
【FAQ】HIVE分区表,字段类型变更后产生has an incompatible Parquet schema for column ‘table.field‘. Column type: xxxx
异常1、常见异常StatementCallback; uncategorized SQLException for SQL [select * from `xxx` where time= '20190404']; SQL state [HY000]; error code [0]; File 'hdfs://xxx/xxx/time=20190404/xxxxxxxxxx' has an incompatible Parquet schema for column 'xxx.xxx'. Column原创 2021-12-15 10:28:41 · 2277 阅读 · 0 评论 -
【FAQ】HIVE多行聚合- concat_ws(‘,‘, collect_list(t.class))
场景分组后的数据多行聚合成一行序号idclasstag11AAf21BBf31CCf41DDf51EEf62QQf72WWf82MMf期望序号idclass11AA,BB,CC22QQ,WW,MM实现两步走先分组再拼接with temp as ( select id as id, class as class原创 2021-12-15 14:11:56 · 1754 阅读 · 0 评论 -
【FAQ】Impala常见异常incompatible Parquet schema for column
需求来源impala查询问题描述Impala查询表报如下异常nested exception is java.sql.SQLException: File 'hdfs://nameservice/loongshawn/d/table/p_date=2018-01/part-xxxxxxxxxxxx' has an incompatible Parquet schema for column 'v.table.fileed'. Column type: DOUBLE, Parquet schema:原创 2021-06-28 19:40:33 · 2628 阅读 · 0 评论 -
基站如何记录用户活动轨迹,数据计算赋能
绿码是如何变黄、变红,数据计算赋能原创 2021-08-06 20:47:42 · 1099 阅读 · 0 评论 -
【FAQ】Hive collect_set()无序、collect_list()有序和concat_ws()使用
需求来源对列值分组,并按一定顺序排序,最后多行合并一行,合并值左到右逆序排列。问题描述select t.id, concat_ws(',', collect_set(t.class))from temp tgroup by t.id原始temp数据idclassloongshaw1loongshaw2loongshaw3loongshaw4期望值idclassloongshaw1,2,3,4.原创 2021-07-14 15:26:25 · 12047 阅读 · 0 评论 -
【FAQ】Spark报错: java.lang.UnsupportedOperationException: Unimplemented type:DoubleType
异常回顾2019-01-01 11:24:32,035 WARN org.apache.spark.scheduler.TaskSetManager: Lost task xx.0 in stage x.0 (xxx 12, xxx, executor 3): org.apache.spark.SparkException: Task failed while writing rows at org.apache.spark.sql.execution.datasources.FileFormatWri原创 2021-06-09 17:05:48 · 579 阅读 · 0 评论 -
impala/spark/hive/presto常见的命令汇总
impala/spark常见的命令汇总 待完善原创 2020-04-26 13:42:03 · 420 阅读 · 0 评论