1.下载大数据插件pentaho-big-data-plugin,将下载的插件复制到kettle的plugin文件夹
2.修改pentaho-big-data-plugin文件夹下的plugin.properties文件的active.hadoop.configuration=hdp26 属性,其中hdp26为hadoop-configurations大数配置的所在的文件夹名称
3.将hadoop集群下的hadoop/etc/conf/下的core-site,hbase-site,hdfs-site,hive-site,mapred-site,yarn-site6个文件拷贝到第2不中配置的hdp26中
4.修改host文件,将集群的ip地址配置进host文件中(注意:在kettle中连接需要以计算机名连接)
5.配置hdfs连接连接信息,测试通过
kettle对大数据做ETL
最新推荐文章于 2025-03-19 22:55:50 发布