使用jstack命令的一次排坑记录

在使用JedisCluster实现分布式锁时,高并发导致系统假死。通过jstack发现大量JedisPool线程处于WAITING状态,调整MaxWaitMillis参数至1000后,问题得以解决。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

昨天使用Redis实现了一个分布式锁,在对这个锁进行压测的过程中,系统出现了假死状态。

我用的是JedisCluster,当并发达到一定数目之后,redis命令就不再执行了,tomcat也无法再对外提供任何服务。后台不报任何异常,CPU占用率并不高,内存也没有爆表。种种迹象都明,可能是系统中的某些线程发生了阻塞,也许是死锁,也许是其它。

开始我以为是我写的分布式锁有问题,于是以各种单线程或低并发做测试,然而并没有发现什么问题;一次只lock一个资源,也不可能导致死锁。所以应该就是高并发导致了系统产生某种故障。

于是我想到了用jstack来查看jvm中线程的运行情况。

当系统再次发生阻塞时,首先在命令行中敲入:jps,拿到当前tomcat的pid 12076,之后在命令行中敲入jstack -l 12076 >> E:/jstack_info1.txt,将thread dump记录输出到一个文件中。

打开后一看,发现有大量的JedisPool线程处于WAITING状态:

“http-nio-8092-exec-200” #241 daemon prio=5 os_prio=0 tid=0x0000000024b2d000 nid=0x6d98 waiting on condition [0x000000003821c000]
java.lang.Thread.State: WAITING (parking)
at sun.misc.Unsafe.park(Native Method)
- parking to wait for <0x0000000779897f18> (a java.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject)
at java.util.concurrent.locks.LockSupport.park(LockSupport.java:175)
at java.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject.await(AbstractQueuedSynchronizer.java:2039)
at org.apache.commons.pool2.impl.LinkedBlockingDeque.takeFirst(LinkedBlockingDeque.java:590)
at org.apache.commons.pool2.impl.GenericObjectPool.borrowObject(GenericObjectPool.java:425)
at org.apache.commons.pool2.impl.GenericObjectPool.borrowObject(GenericObjectPool.java:346)
at redis.clients.util.Pool.getResource(Pool.java:49)
at redis.clients.jedis.JedisPool.getResource(JedisPool.java:226)
at redis.clients.jedis.JedisSlotBasedConnectionHandler.getConnectionFromSlot(JedisSlotBasedConnectionHandler.java:70)
at redis.clients.jedis.JedisClusterCommand.runWithRetries(JedisClusterCommand.java:113)
at redis.clients.jedis.JedisClusterCommand.run(JedisClusterCommand.java:30)
at redis.clients.jedis.JedisCluster.set(JedisCluster.java:123)
at slg.rainbow.lock.RedisDistributeLock.tryGetLock(RedisDistributeLock.java:27)
at slg.rainbow.seckill.service.SeckillWebService.submitOrder(SeckillWebService.java:29)
……

上网随便一搜,爆出好几篇文章来,选两个有代表意义的:
《jedisPool.getResource()方法长时间无响应并且不报错》
《jedisPool.getResource()方法长时间无响应并且不报错,方法阻塞》

基本上都是关于JedisPool中MaxWaitMillis参数配置的。如果不对这个参数进行显示配置,那么默认MaxWaitMillis=-1,等于-1什么意思呢?就是当JedisPool线程耗尽的时候,永远的阻塞下去……OMG !

于是我把这个参数调成了1000:
在这里插入图片描述
问题终于解决!

jstack命令是JDK中的一个工具,用于打印正在运行的Java进程的线程栈信息。它可以通过以下几种方式使用: 1. 使用jstack命令连接到正在运行的进程,通过指定进程ID来获取线程栈信息。例如,可以使用以下命令查看进程ID为19332的线程堆栈信息: jstack 19332 2. 使用jstack命令连接到已挂起的进程,通过指定进程ID来获取线程栈信息。在某些情况下,jstack命令可能没有响应,可以使用选项"-F"来强制打印线程栈信息。例如,可以使用以下命令查看进程ID为19332的已挂起进程的线程堆栈信息: jstack -F 19332 3. 使用jstack命令连接到核心文件(core file),通过指定可执行文件和核心文件的路径来获取线程栈信息。例如,可以使用以下命令查看可执行文件和核心文件的路径为"executable"和"core"的线程堆栈信息: jstack executable core 除了以上用法外,jstack命令还支持一些选项来获取更详细的信息。例如,选项"-m"可以打印Java栈和本地方法栈,选项"-l"可以打印关于锁的额外信息。 总结来说,jstack命令是JVM自带的Java堆栈跟踪工具,用于生成当前时刻的线程快照,以定位线程出现长时间停顿的原因。它还可以用于获取core文件的Java堆栈和本地方法栈信息,或者附属到正在运行的Java程序中查看实时的线程堆栈信息。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [jstack 命令解读](https://blog.youkuaiyun.com/qq_19922839/article/details/115379649)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *3* [jstack命令解析](https://blog.youkuaiyun.com/weixin_44588186/article/details/124680586)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值