Hadoop本地模式安装

上官网下载合适的安装包 http://hadoop.apache.org/

 

1 把安装包放到合适的目录下,安装到 /usr/local

1、在安装包所在的文件夹,右击打开控制台 

2、解压安装包到指定的位置

tar -zxvf hadoop-2.9.2.tar.gz -C /usr/local

 

2 运行MapReduce程序来验证安装是否成功

1、用hadoop自带的wordcount例子来在本地模式下测试跑mapreduce 

在安装目录下新建一个input文件夹,从本地系统传送个txt文件到该文件夹。

 

 文件内容:to be or not to be ,that is a question!

2、在控制台中输入如下命令,input为输入路径,output为输出路径(统计input目录下所有文件的单词出现的次数)

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.9.2.jar wordcount input output

运行成功的话,会自动生成一个output的文件夹,里面包含如下文件(出现SUCCESS文件说明安装成功)

### Hadoop本地模式安装配置MySQL教程 #### 1. 安装Hadoop本地模式下运行Hadoop,首先需要下载适合操作系统的Hadoop二进制包。解压后设置环境变量`HADOOP_HOME`指向解压目录,并将其加入到`PATH`中以便全局调用。 以下是基本的环境变量配置方法: ```bash export HADOOP_HOME=/path/to/hadoop export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin ``` 验证Hadoop是否成功安装可以通过执行以下命令来测试: ```bash hadoop version ``` 如果显示Hadoop版本号,则说明安装成功[^3]。 --- #### 2. 配置Hadoop核心参数 编辑Hadoop的核心配置文件`core-site.xml`,指定临时数据存储路径: ```xml <configuration> <property> <name>fs.defaultFS</name> <value>file:///</value> </property> <property> <name>hadoop.tmp.dir</name> <value>/app/hadoop/tmp</value> </property> </configuration> ``` 此配置表示Hadoop将以本地文件系统作为默认文件系统,并将临时数据存放在指定路径下[^4]。 --- #### 3. 安装MySQL 下载并安装适用于当前操作系统版本的MySQL软件包。完成后启动MySQL服务并通过以下命令创建用于测试的数据表结构: ```sql CREATE DATABASE testdb; USE testdb; CREATE TABLE employees ( id INT PRIMARY KEY, name VARCHAR(50), salary FLOAT ); INSERT INTO employees VALUES (1, 'Alice', 5000), (2, 'Bob', 6000); ``` 确保MySQL已正常工作,并记录好访问所需的用户名和密码(例如root用户及其对应密码)[^2]。 --- #### 4. 下载MySQL JDBC驱动程序 为了使Hadoop能够通过Java代码连接至MySQL数据库,需获取官方发布的最新版MySQL Connector/J库文件。将其放置于Hadoop类加载器可触及的位置,比如`${HADOOP_HOME}/share/hadoop/common/lib/`或者`${SQOOP_HOME}/lib/`目录内[^1]。 --- #### 5. 使用Sqoop导入导出数据 假设已经完成上述准备工作之后,可以利用Apache Sqoop工具实现批量传输功能。下面展示如何列举远程主机上的可用数据库列表实例: ```bash sqoop list-databases \ --connect jdbc:mysql://localhost:3306/ \ --username root \ --password your_password ``` 其中替换实际使用的登录凭证部分字段值为真实情况下的字符串表达形式。 对于更复杂的场景还可以考虑编写自定义脚本进一步扩展自动化程度。 --- #### 6. Hive与MySQL元数据集成(可选) 当希望借助Hive查询分析存储于关系型DBMS里的资料集时,除了常规步骤之外还需要额外关注几个方面事项:确认两者兼容性的前提条件下调整hive-site.xml文档属性设定如下所示例子那样做相应修改;另外记得把先前提到过的mysql-connector-java.jar拷贝过去对应的$HIVE_HOME/lib子目录底下才行哦! ```xml <configuration> <property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://localhost/metastore?createDatabaseIfNotExist=true</value> </property> <property> <name>javax.jdo.option.ConnectionDriverName</name> <value>com.mysql.cj.jdbc.Driver</value> </property> <property> <name>javax.jdo.option.ConnectionUserName</name> <value>root</value> </property> <property> <name>javax.jdo.option.ConnectionPassword</name> <value>your_password</value> </property> </configuration> ``` 这样就可以让Hive顺利读取来自外部RDBMS源端的信息资源啦![^2] ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值