Hadoop 介绍
依据官网介绍,Hadoop有四大模块https://hadoop.apache.org/old/ (还有三大核心)
Apache™Hadoop®项目开发了用于可靠、可伸缩、分布式计算的开源软件。
Apache Hadoop软件库是一个框架,它允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它被设计成从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。库本身不是依赖硬件来提供高可用性,而是设计用于检测和处理应用程序层的故障,因此在计算机集群上提供高可用性服务,每个集群都可能容易出现故障。
依据千峰视频介绍学习如下:
其实他们都是Hadoop的子项目。
Hadoop单机版安装及应用
解压到指定目录
hadoop是基于Java写的,所以如果脱离Java类文件,就是没有啥用的,所以需要告诉hadoop,Java的类文件在哪里 保存,退出
到此,hadoop的单机版安装完毕
进行测试统计
到此,统计完成