- 博客(4)
- 收藏
- 关注
原创 Hadoop-伪分布
经过很多年的发展,hadoop生态圈不断的完善和完善,除了核心HDFS和MapReduce以外,Hadoop生态圈还包括zookeeper、HBase,Hive、pig、Mahout、Sqoop、Flume、Ambari等 接下来我会更好的完善hadoop生态圈。 Ambari:安装、部署、配置和管理工具 zookeeper:分布式协作服务 HBase:分布式数据库 hive:数据仓库 pig:数据流处理 MapReduce:分布式计算框架 YARN:资源调度和管理框架 HDFS:分布式文
2021-12-16 14:59:10
1480
原创 Hadoop-安装JDK
之前我们按照了VM虚拟机、Moba。解释一下都有什么作用: 1.Vm虚拟机---想要在windows电脑上操作linux操作系统需要安装这个软件 2.CentOS---是linux操作系统 3.配置ip、主机名、映射、虚拟机的网络适配器、windows的网络适配器 4.本机windows就可以和linux传输 5.Moba软件就是为了让linux和windows连接 6.Hadoop、jdk都是linux的软件 今儿我们来按照一个比较比较重要的--JDK 首先我们先打开VM然后再打卡Moba
2021-12-14 11:17:56
3392
原创 Hadoop-基础配置
首先最重要的是本地电脑上有VM(我的电脑上centOS7)、Moba。我们先网络配置、连接MObaxterm。 1、在虚拟机上修改主机名 Hostnamectl set -hostname Hadoop101<自己编写的主机名> 1-1、修改ip地址 vi /etc/sysconfig/network-scripts/ifcfg-ens33 修改为静态获取IP BOOTPROTO=”static” 添加IP地址 IPADDR=192.168.1.100 添加网关 GA...
2021-12-12 15:19:10
1814
原创 Hadoop-初始Hadoop
一、什么是Hadoop Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统( Distributed File System),其中一个组件是HDFS(Hadoop Distributed File System)。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数
2021-12-12 14:18:19
118
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人