GiViP:分布式图处理系统的可视化分析器
1. 相关工具与技术概述
在分布式图处理系统的分析中,有许多相关工具,但它们各有局限。一些工具在底层运行,无法区分同一集群上的并发计算。高性能计算(HPC)分析器如Gprof和VTune,能对计算执行进行采样并分析代码各部分的耗时。BigDebug为运行在Apache Spark上的计算提供交互式实时调试原语,Graft则为Apache Giraph实现的TLAV程序提供图形化调试界面,但这些工具都缺乏资源分析功能。CloudGazer是一个可视化系统,用于监控基于云的网络,不过它侧重于优化云基础设施以降低能耗和提高服务质量,与我们的关注点不同。
时间序列可视化方面,分析计算涉及对时变参数的分析。经典的时间序列数据图表包括折线图、小倍数图、堆叠图、地平线图和编织图等。不同的可视化方式适用于不同的任务,共享空间可视化在局部视觉跨度的比较中表现出色,而分割空间技术在处理大量并发时间序列且需要大视觉跨度的任务时更具鲁棒性。此外,还有一些应用驱动的系统采用了专门的可视化方法,如ThermalPlot用于可视化多属性时间序列数据,CloudLines用于基于时间表示大型动态事件数据集等。
动态图绘制中,GiViP将工作节点间的通信建模为一个图,边的权重基于超步期间工作节点对之间交换的消息数量或大小。虽然相关文献丰富,但我们的通信图拓扑结构随时间变化的可能性较小,因为每个工作节点与管理其顶点邻居的工作节点通信,不受超步影响。
2. GiViP系统的任务与需求
GiViP系统的设计围绕以下主要任务:
- T1:分析计算的性能趋势 :从运行时间和流量负载方面评估
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



