
hadoop
文章平均质量分 86
leezsj
这个作者很懒,什么都没留下…
展开
-
Zookeeper&YARN
Zookeeper&YARNZookeeper的概述Zookeeper是什么1. zookeeper是⼀个为分布式应⽤程序提供的⼀个分布式开源协调服务框架。是Google的Chubby的⼀个开源实现,是Hadoop和Hbase的重要组件。主要⽤于解决分布式集群中应⽤系统的⼀致性问题。2. 提供了基于类似Unix系统的⽬录节点树⽅式的数据存储。3. 可⽤于维护和监控存储的数据的状态的变化,通过监控这些数据状态的变化,从⽽达到基于数据的集群管理4. 提供了⼀组原语(机器指令),提供了原创 2021-07-06 22:27:04 · 414 阅读 · 0 评论 -
centos7时间同步
时间服务器设备集群需要有一个统一的时间,来确保所执行的操作的时序正确。 NTP 是网络时间协议(Network Time Protocol)的简称,就是通过网络协议使计算机之间的时间同步化。时区管理查看当前时区timedatectl查看当前可用时区timedatectl list-timezones设置时区timedatectl set-timezone Asia/Shanghai进行时间同步方法最简单的方法,让所有集群(这里默认集群中有三台服务器:master,sl原创 2021-07-02 16:06:13 · 8069 阅读 · 0 评论 -
hadoop,hdfs,集群安装
大数据概念海量数据,具有⾼增⻓率、数据类型多样化、⼀定时间内⽆法使⽤常规软件⼯具进⾏捕 捉、管理和处理的数据集合。特征 Volume:巨⼤的数据量 Variety:数据类型多样化 --(1):结构化的数据 即有固定格式和有限⻓度的数据。 --(2):半结构化的数据 是⼀些XML或者HTML的格式的数据。 --(3):⾮结构化的数据 现在⾮结构化的数据越来越多,就是不定⻓、⽆固定格式的数据,例如⽹ ⻚、语⾳,视频等。 Velocity: 数据增⻓速度快原创 2021-07-02 15:14:10 · 640 阅读 · 0 评论