- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 个人Hive学习笔记
HiveHive基本介绍产生原因方便对文件及数据的元数据进行管理,提供统一的元数据管理方式;提供更加简单的方式来访问大规模的数据集,使用SQL语言进行数据分析。介绍Hive在使用过程中,是使用SQL语句来进行数据分析,由SQL语句到具体的任务执行还需要经过解释器、编译器、优化器和执行器四个部分才能完成。1)解释器 调用语法解释器和语义分析器将SQL语句转换成对应的可执行的...
2020-04-28 14:44:36
746
原创 个人HBase学习笔记
HBase笔记HBase简介Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩、实时读写的分布式数据库利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,利用Zookeeper作为其分布式协同服务。主要用来存储非结构化和半结构化的松散数据(列存NoSQL数据库)HBase数据模型RowKey是...
2020-04-17 17:22:49
572
原创 个人Hadoop学习笔记
大数据 启蒙分治思想适用于以下场景:Redis集群ElasticSearchHBaseHadoop生态等等场景大数据重点核心思想分而治之并行计算计算向数据移动数据本地化读取Hadoop的项目中,包含了如下模块Hadoop CommonHadoop Distributed File System (HDFS)Hadoop YARN(分布式资源管...
2020-04-08 23:39:48
681
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人