数据仓库
文章平均质量分 75
西二旗卷饼王
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
流处理-flink笔记
从Lambda架构到Kappa架构再到?浅谈未来数仓架构设计~https://developer.aliyun.com/article/752406原创 2021-11-24 12:05:32 · 2409 阅读 · 0 评论 -
HIVE批量更新表信息
ALTER TABLE 表名 REPLACE COLUMNS( -- 更新后的表信息 `id` bigint COMMENT '自增主键', `cid` string COMMENT '创建人(初始化数据值为初始化)', `ctime` string COMMENT '创建时间', `uid` .原创 2020-07-03 19:06:02 · 1818 阅读 · 0 评论 -
hive解析json字符串函数get_json_object采坑
1、一般字符串解析没问题如:{"address":{"f1":"","f2":"","f3":36091591,"f4":120374680},"boxTotalPrice":2.0,"channel":"dianping_app_ios_iphone","dp_user_id":267原创 2018-11-22 12:06:00 · 14792 阅读 · 0 评论 -
HIVE用法及原理
一、抽样查询(表支持,视图不支持抽样)https://www.jianshu.com/p/c6ca99e26657 tablesample函数 数据块抽样 :percent 大小 行数 分桶表取样: tablesample(bucket xout of y on 列名或rand()),分成y份,取第x份 二、hive中order by,sort by,...原创 2019-02-27 15:34:24 · 197 阅读 · 0 评论
分享