Hadoop 介绍

依据官网介绍,Hadoop有四大模块https://hadoop.apache.org/old/ (还有三大核心)

Apache™Hadoop®项目开发了用于可靠、可伸缩、分布式计算的开源软件。
Apache Hadoop软件库是一个框架,它允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它被设计成从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。库本身不是依赖硬件来提供高可用性,而是设计用于检测和处理应用程序层的故障,因此在计算机集群上提供高可用性服务,每个集群都可能容易出现故障。
依据千峰视频介绍学习如下:


其实他们都是Hadoop的子项目。

Hadoop单机版安装及应用

解压到指定目录


![]()

![]()

![]()
hadoop是基于Java写的,所以如果脱离Java类文件,就是没有啥用的,所以需要告诉hadoop,Java的类文件在哪里
保存,退出

到此,hadoop的单机版安装完毕

进行测试统计




到此,统计完成
本文深入介绍了Hadoop分布式计算框架,包括其四大模块和三大核心组件,详细讲解了Hadoop如何实现可靠、可伸缩的数据处理。文章还涵盖了Hadoop的单机版安装步骤及应用测试,为读者提供了全面的Hadoop入门指南。

被折叠的 条评论
为什么被折叠?



