准备工作:
1.相互之间版本是否对应
在正式开始之前,需要查看自己的Hadoop、hbase、hive、kettle版本是否相互支持。可以到官网查看版本支持或者网上看网友整理的版本支持结果。
2.各个组件是否能够成功运行
环境搭建好之后可以测试测试。如果服务和进程启动不起来,后续操作也就进行不下去了。
3.kettle当中文件的配置
需要将要连接的master上的一些配置文件覆盖kettle的某个目录下相应的文件。
以上三个部分都可以单独写一篇简文,后续有时间的话,我会去发布相应的文章,然后把链接附到上面。
4.启动命令(分先后)
涉及大数据组件:hadoop、zookeeper、hive、hbase
启动hadoop集群:start-all.sh
启动zookeeper:sh bin/zkServer.sh start
启动hbase:bin/start-hbase.sh
启动hiveserver2:bin/hiveserver2