复杂应用的内存配置建议
从以下几个方面考量数据库运算过程中单个GBase集群节点(gnode)各算子的内存需求(假定10节点集群):
参与运算的数据量
以一个2亿行的表与3千万行的表进行join运算,并对join运算结果进行group by聚集,最终得到的结果行数为1.5亿行的场景为例,参与运算的数据量为2.3亿行,超过100GB(不含不参与运算的字段),得到的结果集也超过80GB;对于10节点集群,每节点承载的运算数据量超过10GB。
sql执行过程中的中间结果集大小
本文探讨了在处理大规模数据时GBase集群节点的内存需求,包括参与运算的数据量、中间结果集大小及并发数等因素。针对不同类型的数据库运算提出了具体的配置建议。
复杂应用的内存配置建议
从以下几个方面考量数据库运算过程中单个GBase集群节点(gnode)各算子的内存需求(假定10节点集群):
参与运算的数据量
以一个2亿行的表与3千万行的表进行join运算,并对join运算结果进行group by聚集,最终得到的结果行数为1.5亿行的场景为例,参与运算的数据量为2.3亿行,超过100GB(不含不参与运算的字段),得到的结果集也超过80GB;对于10节点集群,每节点承载的运算数据量超过10GB。
sql执行过程中的中间结果集大小
472
910
428
3270
5002

被折叠的 条评论
为什么被折叠?