
线上问题
文章平均质量分 58
zincooo
这个作者很懒,什么都没留下…
展开
-
tez作业报错java.lang.UnsatisfiedLinkError
hive udf问题原创 2024-07-16 14:52:06 · 339 阅读 · 0 评论 -
上传文件报错Failed to read expected SASL data transfer protection handshake from client
1.客户端conf.set dfs.data.transfer.protection=authentication。1.表象报错显示java客户端写block失败。服务端开启了加密传输,客户端未与该配置保持一致。2.客户端代码读取hdfs相关的配置文件。2.hdfs客户端可以上传成功。3.传输端口telnet可以通。原创 2024-05-06 16:11:13 · 526 阅读 · 2 评论 -
Kerberos认证报错java.net.SocketTimeoutException: Receive timed out
查看报错堆栈里关键的一行UDPClient.receive,所以本次请求使用的是udp连接。krb5中加入udp_preference_limit = 1 禁用udp服务。原创 2024-05-06 16:09:22 · 212 阅读 · 0 评论 -
kyuubi提交任务异常报错Unauthorized connection for super-user from IP
举例:B用户访问开启kerberos的hadoop集群,此时以B用户的名义去访问hadoop集群,仅仅认证信息会使用A用户的认证信息去完成认证。在kerberos环境下,如果用户需要用其他用户的kerberos凭证来完成认证,此时就需要配置proxy user。kyuubi正常会提交spark session 会到yarn上启动application。线上加载的配置为固定的主机,所以通过这几个主机之外的其他主机不能代理用户提交。hadoop.proxyuser.hive.hosts 为* 是没有问题的。原创 2024-03-08 09:26:33 · 881 阅读 · 0 评论 -
spark获取hadoop服务token
spark提交作业不含hbase的相关逻辑为什么会去获取hbase服务的token原创 2023-10-20 17:15:24 · 2203 阅读 · 0 评论 -
tez作业运行慢
后面对比了map task的输入文件,这个container接收的明显要多,导致map task长尾,拖慢整个作业的运行时长。但是通过监控查看当时集群仍有很多的可用资源,从后续的日志看,1分多钟后也获取到了正常的资源情况,但此时task数量已经计算完了并提交请求了。发现某个map task的运行时间是其他map task的三倍(这里00是map task、01是reduce task)对比这个作业两天运行的app日志,发现以下情况:分配的container数量,有问题的作业明显要少几十倍。原创 2023-10-13 09:16:49 · 574 阅读 · 0 评论 -
beeline连接报错Required field ‘client_protocol‘ is unset
该问题由于beeline工具的版本与服务端不一致导致的,实际也就是beeline所用的hive-jdbc jar包版本不一致。客户端和服务端使用正确一致版本的jar包即可。使用beeline连接SparkThriftServer报错。原创 2023-09-20 09:31:41 · 624 阅读 · 1 评论 -
YARN nodemanager节点unhealthy报告reached unrecoverable
ContainerLaunch如果在launchContainer或者relaunchContainer时抛出了ConfigurationException 就将nodemanager标记为不健康节点。报告信息显示 Linux Container Executor reached unrecoverable exception。也可以检查下nodemanager的目录权限是否有问题。查看日志是launch container时候报错的。这里恢复的话可以尝试重启nodemanager服务。原创 2023-07-04 15:35:17 · 377 阅读 · 0 评论