
Hadoop大数据
文章平均质量分 95
我乐了.
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
第05讲:手动模式构建双 Namenode+Yarn 的 Hadoop 集群(上)
本课时主要介绍了如何通过手动方式去构建一个双 Namenode + Yarn 的 Hadoop 集群系统,手动部署方式有助于我们了解 Haoop 的内部运作机制和技术细节,这对于大数据运维来说非常重要。原创 2024-01-12 15:12:31 · 854 阅读 · 0 评论 -
第05讲:手动模式构建双 Namenode+Yarn 的 Hadoop 集群(上)
在分布式文件系统 HDFS 中,NameNode 是 master 角色,当 NameNode 出现故障后,整个 HDFS将不可用,所以保证 NameNode 的稳定性至关重要。在 Hadoop1.x 版本中,HDFS 只支持一个NameNode,为了保证稳定性,只能靠 SecondaryNameNode 来实现,而 SecondaryNameNode不能做到热备,而且恢复的数据也不是最新的元数据。基于此,从 Hadoop2.x 版本开始,HDFS 开始支持多个。原创 2024-01-12 15:09:55 · 1035 阅读 · 0 评论 -
第04讲:自动化运维工具 Anible 在部署大数据平台下的应用(下)
playbook 字面意思是剧本,现实中由演员按照剧本表演,在 Ansible 中,这次由计算机进行表演,由计算机安装、部署应用,提供对外服务,以及组织计算机处理各种各样的事情。playbook 文件由 YMAL 语言编写。YMAL 格式类似于 JSON 的文件格式,便于理解、阅读和书写。首先学习了解一下 YMAL 的格式,对后面书写 playbook 很有帮助。以下是 playbook 常用的 YMAL 格式规则。文件的第一行应该以“---”(三个连字符)开始,表明 YMAL 文件的开始;原创 2024-01-12 14:53:29 · 875 阅读 · 0 评论 -
第03讲:自动化运维工具 Anible 在部署大数据平台下的应用(上)
本讲主要介绍自动化运维工具 Ansible 在部署大数据平台下的应用。原创 2024-01-12 14:51:12 · 1010 阅读 · 0 评论 -
第02讲:Hadoop 发行版选型和伪分布式平台的构建
到目前为止,你应该初步了解了大数据以及 Hadoop 相关的概念了。本课时我将介绍 Hadoop 如何快速使用,由于 Hadoop 平台的构建过程相当复杂,它涉及系统、网络、存储、配置与调优,但为了能让你尽快尝鲜体验一下 Hadoop 的功能和特性,我们先一起构建一个伪分布式 Hadoop 集群,也就是一个假的 Hadoop 集群,麻雀虽小,但五脏俱全。伪分布式 Hadoop 集群能够实现 Hadoop的所有功能,并且部署简单,因此非常适合新手进行学习、开发、测试等工作。原创 2024-01-12 14:48:16 · 992 阅读 · 0 评论 -
第01讲:大话 Hadoop 生态圈
到这里,已经介绍完了 Hadoop 生态圈常用的组件,相信你对它们的用途也有了大致了解,后面的文章中,我会详细讲解这些组件的应用与实践,以便于你牢记掌握这些组件的使用。今天的内容比较多,这源于大数据生态圈组件繁多以及应用的复杂性,但这都值得。如果说今天我希望你看完文章后,还能记住些什么,简单的一句话就是:经典的大数据架构以及常用组件的功能。。原创 2024-01-12 11:21:05 · 974 阅读 · 1 评论