- 博客(3)
- 收藏
- 关注
原创 Hive的基本概念以及安装
第1章 Hive基本概念 1.1 什么是hive 1)hive 简介 Hive:由Facebook开源用于解决海量结构化日志的数据统计工具。 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能 2)**Hive本质:**将HQL转化成MapReduce程序 数据仓库通过sql进行统计分析 将sql语言中常用的操作(select、where、group等)用MapReduce写成很多模板 所有的MapReduce模板封装在Hive 中 基于上面的三步:
2021-12-23 19:44:28
900
原创 HDFS概述以及HDFS的Shell和API的相关操作
第1章 HDFS 1.1 HDFS产生北京和意义 随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。 HDFS(Hadoop Distributed File System):它是一个文件系统。用于存储文件,通过目录树来定位文件;其次,它是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色。 使用场景:适合一次写入
2021-12-10 22:55:50
1444
原创 简单的Markdown语法学习
Markdown学习 标题 三级标题 四级标题 字体 Hello,World! Hello,World! Hello,World! Hello,World! 引用 冰冻三次非一日之寒 分割线 图片 点击调转页面 列表 A B C a b c 表格 名字 性别 生日 小王 男 2020.1.1 代码 hello world ...
2020-11-02 16:31:53
99
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人