
Hadoop
WANG_DDD
这个作者很懒,什么都没留下…
展开
-
Hadoop介绍--Hadoop的家族
Hadoop家族介绍Apache Hadoop:是Apache开源组织的一个分布式计算开源框架,提供了一个分布式文件系统子项目(HDFS)和支持MapReduce分布式计算的软件架构,已成为一个完整的生态系统。支持的操作系统:Windows、Linux和OS XApache Hive: 是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,通过类SQL语句快速实现简单的M...原创 2018-07-05 19:44:41 · 2246 阅读 · 0 评论 -
zeppelin(齐柏林)的配置和使用
查看zeppelin的端口号[root@localhost ~]#vi /usr/hdp/share/hst/activity-explorer/conf/zeppelin-site.xml<property> <name>zeppelin.server.port</name> <value>9060</value> &...原创 2018-07-13 21:31:23 · 2965 阅读 · 0 评论 -
制作本地yum源--Ambari离线安装
1安装 Apache HTTP 服务器:允许 http 服务通过防火墙(永久)。[root@localhost ~]# yum install httpd[root@localhost ~]# firewall-cmd --add-service=http[root@localhost ~]# firewall-cmd --permanent --add-service=http 2添加 Apac...原创 2018-07-15 21:53:04 · 1992 阅读 · 0 评论 -
Spark三种集群部署的区别
Spark最主要资源管理方式按排名为Hadoop Yarn, Apache Standalone 和Mesos。在单机使用时,Spark还可以采用最基本的local模式。 目前Apache Spark支持三种分布式部署方式,分别是standalone、spark on mesos和 spark on YARN,其中,第一种类似于MapReduce 1.0所采用的模式,内部实现了容错性和资源管理,...转载 2018-09-17 11:06:48 · 1275 阅读 · 0 评论