- 博客(2)
- 收藏
- 关注
原创 数据分享
中国统计年鉴 https://www.yearbookchina.com/navisearch-2-0-0-1-china-0.html; 北京市统计年鉴 https://www.yearbookchina.com/navisearch-2-0-3-1-beijing-0.html; 天津市统计年鉴 https://www.yearbookchina.com/navisearch-2-0-3-1-...
2020-03-29 16:23:25
326
原创 Hive常用库表操作及知识汇总
背景 数据仓库列式存储(parquet) parquet是面向分析型业务的列式存储格式,是一种支持嵌套结构的存储格式,并且使用了列式存储的方式提升查询性能。 无论数据处理框架,数据模型或编程语言的选择如何,Apache Parquet都是Hadoop生态系统中任何项目可用的列式存储格式。 特点: 可以跳过不符合条件的数据,只读取需要的数据,降低IO数据量。 压缩编码可以降低磁盘存储空间。。 只读...
2020-01-20 10:49:34
332
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅