Kettle连接Hadoop clusters 报错

本文记录了使用Kettle 8.2连接Hadoop集群遇到的问题,包括9.1版本不兼容、配置XML文件问题以及缺少guava.jar导致的错误。通过覆盖XML配置文件、替换jar驱动和添加缺失的guava.jar,最终成功解决连接问题。

Kettle连接Hadoop 踩坑

记录一下自己Kettle连接Hadoop 的踩坑过程,以备后查。

hadoop环境

云虚拟机安装hadoop3.2,hbase2.2.6

9.1与8.2的区别

用Kettle9.1创建hadoop clusters时老是无法成功,草草查看了一下官方文档,貌似9.0以前的shim无法用于9.1的版本,因为翻q访问实在太慢,最终没有找到下载适配版本shim的地方,无奈放弃。

8.2连接hadoop

  1. 将服务器上*-site.xml文件覆盖到pdi-ce-8.2\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\hdp30下
  2. 用服务器上相应版本的jar驱动覆盖pdi-ce-8.2\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\hdp30\lib、
    pdi-ce-8.2\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\hdp30\lib\client、pdi-ce-8.2\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\hdp30\lib\pmr版本
  3. 修改plugin.properties 中 active.hadoop.configuration,指向对应shime(hdp30)
  4. 启动spoon,在转换下创建hadoop clusters,配置如下:
### 如何解决用户主目录访问权限问题 #### 检查并修复主目录权限设置 当遇到 `could not chdir to home directory` 或者 FTP 连接失败提示 "530 User cannot log in, home directory inaccessible" 时,通常是因为用户的主目录权限配置不正确。应先确认 `/home/username` 文件夹及其内部文件的拥有权和访问模式是否适当。 对于 Linux 系统中的普通用户账户来说,理想的主目录权限应当如下: - 主目录属于该特定用户以及其主要组; - 权限位通常是 `drwx------` (即700),这意味着只有所有者可以读取、写入及进入此目录; 如果发现权限异常,则可以通过命令修正: ```bash chown username:groupname /home/username chmod 700 /home/username ``` 针对某些特殊情况下的权限调整[^2],比如整个 `/home` 下面某个子目录被意外更改为了其他用户的权限,这可能会阻止系统上的所有用户正常登录。此时应该恢复默认状态: ```bash chown root:root /home/subdirectory chmod 555 /home/subdirectory ``` #### 验证 SELinux 设置影响 有时即使常规权限看起来没问题,SELinux 安全策略也可能阻碍对主目录的访问。可通过临时禁用 SELinux 测试这个问题是否存在关联,并考虑长期解决方案如定义合适的上下文标签来允许合法操作而不违反安全政策[^1]。 #### 使用正确的 shell 路径 确保指定给用户的 Shell 是有效的可执行程序路径。例如,在创建新用户时不慎指定了不存在或不可达的位置作为默认Shell也会引发类似的错误消息。检查/etc/passwd 中的相关条目以保证指向的是实际存在的shell解释器,像这样: ```plaintext username:x:uid:gid:User Name:/home/username:/bin/bash ``` 通过上述措施能够有效处理大部分由于权限不当引起的无法切换至个人工作空间的情况。当然具体实施前最好备份现有数据以防万一,并仔细阅读官方文档获取更详尽指导[^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值