深入解析Storm集群资源争用问题及解决方案
1. JVM内存争用问题
在使用Storm时,JVM内存争用是一个常见问题。当spouts和/或bolts尝试消耗的内存超过JVM分配的内存时,会导致OOM错误和/或长时间的GC暂停。以下是具体的问题、解决方案及相关讨论。
1.1 问题描述
spouts和/或bolts消耗的内存超过JVM分配的内存,引发OOM错误和长时间GC暂停。
1.2 解决方案
- 增加拓扑使用的工作进程数量 :通过为拓扑添加工作进程,可以降低该拓扑所有工作进程的平均负载,从而减少每个工作进程(JVM)的内存占用,有望消除JVM内存争用。
- 增加JVM(工作进程)的大小 :不过,增加JVM大小可能需要更改运行它们的机器/VM的大小,因此如果可以,建议优先选择“增加工作进程”的解决方案。
1.3 讨论
不同的拓扑有不同的内存使用模式。随着时间的推移,我们从每个工作节点使用四个500MB内存的工作进程,转变为每个工作节点使用两个1GB内存的工作进程。在调整JVM内存大小时要谨慎,因为当跨越某些关键点(如500MB、1GB、2GB和4GB)时,垃圾回收时间可能会显著增加。
2. 工作节点内存争用问题
工作节点整体也有有限的可用内存,除了运行Storm工作进程(JVM)所需的内存外,还需要内存来运行Supervisor进程和其他进程,否则可能会发生内存争用,导致节点交换内存。
超级会员免费看
订阅专栏 解锁全文
879

被折叠的 条评论
为什么被折叠?



