Spark在shuffle数据的时候遇到的问题:java.io.IOException: Connection reset by peer

本文探讨了Spark在进行大数据集shuffle操作时遇到的问题,特别是在使用Netty传输数据时发生的IOException。文章分析了错误产生的原因,并提出了一种解决方案,通过更改配置使用NIO替代Netty来减少此类错误的发生。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

java.io.IOException: Connection reset by peer
        at sun.nio.ch.FileDispatcherImpl.read0(Native Method)
        at sun.nio.ch.SocketDispatcher.read(SocketDispatcher.java:39)
        at sun.nio.ch.IOUtil.readIntoNativeBuffer(IOUtil.java:223)
        at sun.nio.ch.IOUtil.read(IOUtil.java:192)
        at sun.nio.ch.SocketChannelImpl.read(SocketChannelImpl.java:379)
        at io.netty.buffer.PooledUnsafeDirectByteBuf.setBytes(PooledUnsafeDirectByteBuf.java:313)
        at io.netty.buffer.AbstractByteBuf.writeBytes(AbstractByteBuf.java:881)
        at io.netty.channel.socket.nio.NioSocketChannel.doReadBytes(NioSocketChannel.java:242)
        at io.netty.channel.nio.AbstractNioByteChannel$NioByteUnsafe.read(AbstractNioByteChannel.java:119)
        at io.netty.channel.nio.NioEventLoop.processSelectedKey(NioEventLoop.java:511)
        at io.netty.channel.nio.NioEventLoop.processSelectedKeysOptimized(NioEventLoop.java:468)
        at io.netty.channel.nio.NioEventLoop.processSelectedKeys(NioEventLoop.java:382)
        at io.netty.channel.nio.NioEventLoop.run(NioEventLoop.java:354)
        at io.netty.util.concurrent.SingleThreadEventExecutor$2.run(SingleThreadEventExecutor.java:111)
        at java.lang.Thread.run(Thread.java:745)

2016-03-10,14:39:26,362 ERROR org.apache.spark.network.server.TransportRequestHandler: Error sending result ChunkFetchSuccess{streamChunkId=StreamChunkId{streamId=19949029161, chunkIndex=13}, buffer=FileSegmentManagedBuffer{file=/home/work/hdd9/yarn/c3prc-hadoop/nodemanager/usercache/h_sns/appcache/application_1447144693824_327984/blockmgr-fa013657-df4b-402c-84d4-8fc022853d88/35/shuffle_2_1290_0.data, offset=0, length=1039492}} to /10.114.2.44:61221; closing connection

在spark1.2中,大数据集shuffle的时候,节点之间传输数据时使用netty,有的时候会出现问题。修改方法为:

val conf = new SparkConf().set("spark.shuffle.blockTransferService", "nio"), 即用nio代替netty。

但是我试了以下不行。

之后,我观察了以下Spark UI中失败的stage的error信息,发现所有的error都是从同一个节点报出来的。

我们可以猜测是不是该节点在shuffle过程中分配到过多的数据导致。

检查了以下代码,发现大数据集a中(a的数据形式为(key,value))出现大量key为“”的空字符串形式,导致a.leftOuterJoin(b)的时候,会出现大量key为空字符串的结果。这些结果会分配到同一个节点中,导致该节点崩溃。


http://m.blog.youkuaiyun.com/article/details?id=50848392


### Netty 中 `java.io.IOException: Connection reset by peer` 错误解决方案 当在 Netty 客户端发送 HTTPS 请求时遇到 `java.io.IOException: Connection reset by peer` 异常,通常是因为连接被远程主机重置。一种常见的原因是未正确配置目标服务器的信息。 为了修复此问题,在创建管道处理器时应指定目标服务器的地址和端口: ```java socketChannel.pipeline().addLast(context.newHandler(socketChannel.alloc(), host, port)); ``` 这一步骤确保了客户端能够正确识别并连接到目标服务器[^1]。 另外,如果问题是由于网络中间件(如 Nginx)引起的,则需检查这些组件的配置。特别是对于通过域名访问的情况,Nginx 的设置可能影响请求的成功与否[^2]。 #### 配置 SSL/TLS 支持 HTTPS 请求涉及加密通信,因此还需要确认已适当设置了 SSL/TLS 上下文。可以通过添加 SslContext 来实现安全连接的支持: ```java SslContext sslCtx = SslContextBuilder.forClient() .trustManager(InsecureTrustManagerFactory.INSTANCE).build(); Bootstrap b = new Bootstrap(); b.group(eventLoopGroup) .channel(NioSocketChannel.class) .handler(new ChannelInitializer<SocketChannel>() { @Override protected void initChannel(SocketChannel ch) throws Exception { SSLEngine engine = sslCtx.newEngine(ch.alloc()); ch.pipeline().addLast("ssl", new SslHandler(engine)); // 添加其他必要的处理器... } }); ``` 上述代码片段展示了如何初始化一个带有 SSL 处理程序的通道,这对于处理 HTTPS 流量至关重要。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值