网络功能性能诊断:方法与优化策略
1. 现有性能诊断工具的局限性
在网络功能(NF)性能诊断领域,基于采样和基于插桩的性能诊断工具各有优劣,但都难以同时满足粒度和灵活性的要求。
1.1 基于插桩工具的不足
基于插桩的工具虽能通过简单计算获取时间聚合的全局热点和调用关系,但存在两个主要缺点:
- 可测量范围有限 :以TAU为例,尽管它能利用性能监控计数器(PMC),但无法测量动态加载的库函数。例如,在Perf中,ACL和DPDK相关模块被报告为热点,而TAU却无法对其进行测量。
- 测量开销高 :与基于采样的性能诊断方法相比,基于插桩的方法会引入更大的总体测量开销。人们普遍认为,这会严重干扰NF的性能行为,使测量结果不可信。
1.2 基于采样工具的局限
基于采样的方法在机械上无法实现数据包级别的性能跟踪,难以满足对NF性能进行精细诊断的需求。
2. 性能扰动的研究
性能诊断工具在使用过程中会引入额外的测量开销,那么更高的测量开销是否会导致更大的性能扰动呢?下面从性能分布相似性和干扰系数两个方面进行分析。
2.1 性能分布相似性
捕获NF的性能数据需要额外的测量操作,这些操作会消耗CPU和内存资源,与NF竞争资源,从而降低NF的性能。对于基于PMC的诊断工具,PMC寄存器中记录的值是原始NF性能、测量开销及其相互作用的结果。
为了验证这一点,我们进行了一组实验。构建基于VPP的典型NF(防火墙),评估其原始性能作为基线,然后分别使用基于
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



