云应用的性能监测、管理与分析
在云环境中,虚拟化基础设施的性能对应用服务质量有着至关重要的影响。了解如何测量虚拟化基础设施的性能损伤、管理这些损伤以及对基于云的应用进行分析,对于确保应用的稳定运行和满足用户的服务质量要求至关重要。
虚拟化基础设施性能损伤的测量
测量虚拟化基础设施的性能损伤是确保应用服务质量的第一步。以下是一些关键的测量指标和方法:
- 未交付配置的VM容量 :可以通过像jHiccup这样的工具来测量VM CPU容量的未交付情况。通过比较高频定期调度事件的时间戳,应用程序可以轻松隔离VM未运行的时间间隔。对于网络容量的未交付,可以通过比较输出队列和传输数据统计信息来测量。如果队列深度增加而传输的比特数没有相应增加,则可能表示网络未交付情况。若存储设备有队列和I/O统计信息,类似的技术也可应用于存储。
- 交付降级的VM容量 :由于虚拟机管理程序会让虚拟机实例认为它们可以完全且专用地访问底层物理资源,因此测量降级的资源容量交付情况较为困难。当提供的工作量保持稳定时,工作队列的增长可能表明虚拟化基础设施交付的资源容量减少。同样,IP数据包重传或丢失的增加可能表明云网络基础设施可能拥塞,从而丢弃数据包。分析来宾操作系统或虚拟机管理程序的性能计数器可以深入了解云服务提供商提供的基础设施服务质量。
- 尾部延迟 :虚拟化和云基础设施通常会导致资源(如CPU)访问的尾部延迟明显变长,从而导致用户服务响应时间的尾部延迟变长。可以测量应用服务在面向基础设施的服务边界上的平均延迟和方差(例如磁盘I/O延迟)。传统的监测和表征服务延迟的方法是构建延迟性能互补累积
超级会员免费看
订阅专栏 解锁全文
5160

被折叠的 条评论
为什么被折叠?



