(3) Sqoop安装配置

该博客详细介绍了如何配置和使用Sqoop将MySQL数据库中的数据导入到Hadoop的HDFS,并进一步将数据同步到Hive表中。步骤包括设置环境变量、配置文件、指定数据库连接信息以及执行导入命令。 Sqoop的使用有助于实现大数据环境下的数据迁移和整合。

下载

http://sqoop.apache.org/

把mysql驱动复制到Sqoop的lib目录下

# cp mysql-connector-java-5.1.25.jar  /root/sqoop-1.4.7.bin__hadoop-2.6.0/lib

配置环境 

# cd /home/sqoop/conf
# cp sqoop-env-template.sh sqoop-env.sh
# vi sqoop-env.sh

 vi sqoop-env.sh:

#Set path to where bin/hadoop is available
export HADOOP_COMMON_HOME=/home/hadoop/hadoop-3.1.4

#Set path to where hadoop-*-core.jar is available
export HADOOP_MAPRED_HOME=/home/hadoop/hadoop-3.1.4

更改环境变量

vi /etc/profile

export SQOOP_HOME=/home/sqoop
export PATH=.:${JAVA_HOME}/bin:${HADOOP_HOME}/bin:$PATH:$HIVE_HOME/bin:$SQOOP_HOME/bin

source /etc/profile

配置执行文件

import            //使用import工具
--connect         //指定连接的目标数据库
jdbc:mysql://192.168.10.2:3306/ds0
--username        //数据库用户名
root
--password        //数据库密码
root
--table           //要导入的表名
user
--columns         //要导入的列
id,name,age
--where           //查询条件
id>0
 
//导入到HDFS的路径,mycluster是hadoop下/etc/hadoop/hdfs-site.xml配置的dfs.nameservices,如果不是配置hadoop高可用的话可以直接写namenode所在主机的ip或主机映射名
--target-dir
hdfs://192.168.10.11:9000/sqoop1
 
--delete-target-dir    //若目标目录已存在则删除
-m
1
--as-textfile          //导入的数据以文本格式存放在HDFS上
 
//如果只导入到hdfs可以不用下面内容
--hive-import        //向hive中导入数据
--hive-overwrite     //数据存在则覆盖
--create-hive-table  //创建Hive表
--hive-table         //指定表名
t_user
--hive-partition-key //指定分区字段
id
--hive-partition-value  指定分区名
'2020-10-10'

执行Sqoop

sqoop --options-file /home/sqoop/sqoopconf/conf1

 

代码转载自:https://pan.quark.cn/s/a4b39357ea24 本文重点阐述了利用 LabVIEW 软件构建的锁相放大器的设计方案及其具体实施流程,并探讨了该设备在声波相位差定位系统中的实际运用情况。 锁相放大器作为一项基础测量技术,其核心功能在于能够精确锁定微弱信号的频率参数并完成相关测量工作。 在采用 LabVIEW 软件开发的锁相放大器系统中,通过计算测量信号与两条参考信号之间的互相关函数,实现对微弱信号的频率锁定,同时输出被测信号的幅值信息。 虚拟仪器技术是一种基于计算机硬件平台的仪器系统,其显著特征在于用户可以根据实际需求自主设计仪器功能,配备虚拟化操作界面,并将测试功能完全由专用软件程序实现。 虚拟仪器系统的基本架构主要由计算机主机、专用软件程序以及硬件接口模块等核心部件构成。 虚拟仪器最突出的优势在于其功能完全取决于软件编程,用户可以根据具体应用场景灵活调整系统功能参数。 在基于 LabVIEW 软件开发的锁相放大器系统中,主要运用 LabVIEW 软件平台完成锁相放大器功能的整体设计。 LabVIEW 作为一个图形化编程环境,能够高效地完成虚拟仪器的开发工作。 借助 LabVIEW 软件,可以快速构建锁相放大器的用户操作界面,并且可以根据实际需求进行灵活调整和功能扩展。 锁相放大器系统的关键构成要素包括测量信号输入通道、参考信号输入通道、频率锁定处理单元以及信号幅值输出单元。 测量信号是系统需要检测的对象,参考信号则用于引导系统完成对测量信号的频率锁定。 频率锁定处理单元负责实现测量信号的锁定功能,信号幅值输出单元则负责输出被测信号的幅值大小。 在锁相放大器的实际实现过程中,系统采用了双路参考信号输入方案来锁定测量信号。 通过分析两路参考信号之间的相...
边缘计算环境中基于启发式算法的深度神经网络卸载策略(Matlab代码实现)内容概要:本文介绍了在边缘计算环境中,利用启发式算法实现深度神经网络任务卸载的策略,并提供了相应的Matlab代码实现。文章重点探讨了如何通过合理的任务划分与调度,将深度神经网络的计算任务高效地卸载到边缘服务器,从而降低终端设备的计算负担、减少延迟并提高整体系统效率。文中涵盖了问题建模、启发式算法设计(如贪心策略、遗传算法、粒子群优化等可能的候选方法)、性能评估指标(如能耗、延迟、资源利用率)以及仿真实验结果分析等内容,旨在为边缘智能计算中的模型推理优化提供可行的技术路径。; 适合人群:具备一定编程基础,熟悉Matlab工具,从事边缘计算、人工智能、物联网或智能系统优化方向的研究生、科研人员及工程技术人员。; 使用场景及目标:①研究深度神经网络在资源受限设备上的部署与优化;②探索边缘计算环境下的任务卸载机制与算法设计;③通过Matlab仿真验证不同启发式算法在实际场景中的性能表现,优化系统延迟与能耗。; 阅读建议:建议读者结合提供的Matlab代码进行实践操作,重点关注算法实现细节与仿真参数设置,同时可尝试复现并对比不同启发式算法的效果,以深入理解边缘计算中DNN卸载的核心挑战与解决方案。
### 如何安装配置 Sqoop 以与 HBase 一起使用 #### 准备工作 为了使 Sqoop 能够成功连接并操作 HBase,需先完成必要的环境准备。这包括但不限于确保已正确部署 Apache Hadoop、Apache HBase 及其依赖组件如 Zookeeper。 #### 下载并解压 Sqoop 获取最新版本的 Sqoop 发行版,并将其放置于服务器上的合适位置。通常情况下,下载完成后会得到一个压缩包文件,需要对其进行解压处理以便后续配置[^3]。 ```bash tar zxvf apache-sqoop-*.tar.gz -C /usr/local/ cd /usr/local/apache-sqoop*/ ``` #### 设置环境变量 编辑 `~/.bashrc` 或者 `/etc/profile.d/sqoop.sh` 文件来设置 SQOOP_HOME 和 PATH 环境变量: ```bash export SQOOP_HOME=/usr/local/apache-sqoop* export PATH=$PATH:$SQOOP_HOME/bin source ~/.bashrc # 刷新当前shell环境下的配置 ``` #### 修改 Sqoop 配置文件 进入 `$SQOOP_HOME/conf` 目录下找到 `sqoop-env-template.sh` 并复制一份命名为 `sqoop-env.sh` 。接着修改此脚本内的参数指向本地已经存在的 hadoop 安装目录以及额外添加如下几项用于支持 hbase 功能: ```properties # Set path to where bin/hadoop is available export HADOOP_COMMON_HOME=... # Set path to where hadoop-*-core.jar is available export HADOOP_MAPRED_HOME=... # point to the root of your HBASE installation export HBASE_HOME=... ``` 对于未安装 HBase 和 ZooKeeper 的情况,在上述基础上还需要特别关注 MySQL JDBC Driver 的加载方式。由于缺少部分必要服务端组件的支持,因此建议直接将驱动程序 jar 放置于 $SQOOP_HOME/lib/ 文件夹内。 #### 测试 Sqoop 连接 Mysql 数据库功能 通过执行简单的命令验证 Sqoop 是否能够正常访问外部关系型数据库系统 (RDBMS),例如列出远程主机上所有的 schema 名称列表[^4]: ```bash sqoop list-databases \ --connect jdbc:mysql://<MySQL_HOST>:<PORT>/<DATABASE_NAME> \ --username <USER_NAME> \ --password <PASSWORD> ``` #### 使用 Sqoop 导入数据至 HBase 一旦确认 Sqoop 已经被正确设置了,则可以通过指定相应的选项把来自 RDBMS 的记录迁移到分布式列族存储引擎之中。下面给出的例子展示了怎样利用 sqoop 命令行工具实现从 mysql 向 hbase 表间的数据迁移过程[^1][^2]: ```bash sqoop import \ -D sqoop.hbase.add.row.key=true \ --connect jdbc:mysql://<MYSQL_SERVER>/test \ --username <USERNAME> \ --password <PASSWORD> \ --table student \ --hbase-table student \ --column-family info \ --hbase-row-key stu_no \ -m 1 ``` 以上即为完整的 Sqoop 安装配置流程及其与 HBase 结合使用的具体方法介绍。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值