
大数据基础框架
文章平均质量分 95
大数据生态框架原理
Lowrance_TT
这个作者很懒,什么都没留下…
展开
-
Hadoop 大数据生态框架--Hive
1. Hive 入门1.1 什么是 HiveHive:由Facebook开源用于解决海量结构化日志的数据统计。Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。本质是:将HQL转化成MapReduce程序Hive处理的数据存储在HDFSHive分析数据底层的实现是MapReduce执行程序运行在Yarn上1.2 Hive 的优缺点1.2.1 优点:操作接口采用类SQL语法,提供快速开发的能力(简单、容易上手)。避免了去写M原创 2021-10-12 21:15:25 · 820 阅读 · 0 评论 -
Hadoop 大数据生态框架--总述
1. 前言:什么是大数据?什么是分布式?官方概念就不在这里赘述了,以笔者的理解,所谓大数据,不是指绝对数据量很大,经常有人说 PB,TB级大数据处理技术等等。试想如果未来的硬件性能有跨越式发展,常规软件就能在短时间内对 PB 级数据进行捕捉、管理和处理,那么 PB 级的数据还叫大数据吗?所谓大数据,是相对于存储能力和计算能力来讲的,当数据规模大到一定程度时,无法在一定时间范围内用常规软件工具进行捕捉、管理和处理,需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力。目前「分布式」是大数据场景的原创 2021-09-16 20:46:36 · 915 阅读 · 0 评论 -
Hadoop伪分布搭建手册
Hadoop伪分布集群搭建 第1章 Hadoop集群搭建 1.1前言 Hadoop是一个由Apache基金会所开发的分布式系统基础架构。Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS是一个分布式文件系统(Hadoop Distributed File System),为海量的数据...原创 2019-10-31 20:19:46 · 540 阅读 · 0 评论