Skywalking指标信息

指标分类

指标名称单位参考值计算/采集方式指标说明

Service(服务)

service_cpm

  数据集合(包含服务id,名称,次数)服务每分钟请求数,按次数倒序topN(默认10)
Service(服务)

service_resp_time

ms(毫秒) 数据集合(包含服务id,名称,响应时间)慢响应服务,按时间倒序topN(默认10)
Service(服务)service_apdex 10000数据集合(包含服务id,名称,apdex值)Apdex性能指标,即服务的不健康值,1为满分
Endpoint(接口)endpoint_avgms(毫秒) 数据集合(包含服务id,名称,响应时间)慢接口平均响应时间,按时间正序topN(默认10)
Allall_percentilems(毫秒) 数据集合(包含类型,数值)响应时间百分比,不同百分比的延时时间
Allall_heatmap  数据集合(包含区间,数值)服务响应时间热力分布图,根据时间段内不同响应时间的数量
显示颜色深度, 颜色越深,请求越多
Service(服务)service_sla%100%返回数值10000,除以100为百分比请求成功率
Service(服务)service_percentile  数据集合(包含类型,数值)百分比响应延时
Service(服务)service_throughput_received  数据集合(包含数值)服务接收的吞吐量
Service(服务)service_throughput_sent  数据集合(包含数值)服务发送的吞吐量
ServiceInstance(服务实例)service_instance_cpm  数据集合(包含服务实例id,名称,次数)每个实例每分钟请求数,按次数倒序topN(默认10)
ServiceInstance(服务实例)service_instance_resp_time  数据集合(包含服务实例id,名称,响应时间)慢响应服务实例,按时间倒序topN(默认10)
ServiceInstance(服务实例)service_instance_sla% 数据集合(包含服务实例id,名称,数值)服务实例的请求成功率,按成功率正序topN(默认10)
ServiceInstance(服务实例)service_instance_throughput_received  数据集合(包含数值)服务实例接收的吞吐量
ServiceInstance(服务实例)service_instance_throughput_sent  数据集合(包含数值)服务实例发送的吞吐量
ServiceInstance(服务实例)instance_jvm_cpu% 数据集合(包含数值)JVM占用CPU百分比
ServiceInstance(服务实例)instance_jvm_memory_heapMB(兆) 数据集合(包含数值)JVM内存占用-堆内存使用
ServiceInstance(服务实例)instance_jvm_memory_heap_maxMB(兆) 数据集合(包含数值)JVM内存占用-最大堆内存
ServiceInstance(服务实例)instance_jvm_memory_noheapMB(兆) 数据集合(包含数值)JVM内存占用-直接内存当前使用
ServiceInstance(服务实例)instance_jvm_memory_noheap_maxMB(兆) 数据集合(包含数值)JVM内存占用-最大直接内存
ServiceInstance(服务实例)instance_jvm_young_gc_timems(毫秒) 数据集合(包含数值)JVM垃圾回收时间-young gc回收时间
ServiceInstance(服务实例)instance_jvm_old_gc_timems(毫秒) 数据集合(包含数值)JVM垃圾回收时间-old gc回收时间
ServiceInstance(服务实例)instance_jvm_young_gc_count  数据集合(包含数值)JVM垃圾回收次数-young gc回收次数
ServiceInstance(服务实例)instance_jvm_old_gc_count  数据集合(包含数值)JVM垃圾回收次数-old gc回收次数
ServiceInstance(服务实例)instance_jvm_thread_live_count  数据集合(包含数值)JVM当前活跃的线程数
ServiceInstance(服务实例)instance_jvm_thread_daemon_count  数据集合(包含数值)JVM当前活跃的线程守护数
ServiceInstance(服务实例)instance_jvm_thread_peak_count  数据集合(包含数值)从JVM启动开始曾经活着的最大线程数
ServiceInstance(服务实例)instance_jvm_thread_runnable_state_thread_count  数据集合(包含数值)JVM可运行状态线程数
ServiceInstance(服务实例)instance_jvm_thread_blocked_state_thread_count  数据集合(包含数值)JVM阻塞状态线程数
ServiceInstance(服务实例)instance_jvm_thread_waiting_state_thread_count  数据集合(包含数值)JVM等待状态线程数
ServiceInstance(服务实例)instance_jvm_thread_timed_waiting_state_thread_count  数据集合(包含数值)JVM超时状态线程数
ServiceInstance(服务实例)instance_jvm_class_loaded_class_count  数据集合(包含数值)JVM类加载类数量
ServiceInstance(服务实例)instance_jvm_class_total_unloaded_class_count  数据集合(包含数值)JVM类卸载类数量
ServiceInstance(服务实例)instance_jvm_class_total_loaded_class_count  数据集合(包含数值)JVM类总加载类数量
Endpoint(API端点)endpoint_cpm  数据集合(包含端点id,名称,次数)每个API每分钟请求数,按次数倒序topN(默认10)
Endpoint(API端点)endpoint_avgms(毫秒) 数据集合(包含端点id,名称,响应时间)平均响应时间的最慢的topN个API
Endpoint(API端点)endpoint_sla% 数据集合(包含端点id,名称,数值)每个API的请求成功率
Endpoint(API端点)endpoint_percentile  数据集合(包含类型,数值)当前API每个时间段的响应时间占比
Service(服务)database_access_resp_time  数据集合(包含数值)当前数据库平均响应时间,按时间倒序topN(默认10)
Service(服务)database_access_sla% 数据集合(包含数据库id,名称,数值)当前数据库访问成功率
Service(服务)database_access_cpm  数据集合(包含类型,数值)当前数据库每分钟请求数
Service(服务)database_access_percentile  数据集合(包含类型,数值)数据库不同响应时间占比
Service(服务)top_n_database_statement  数据集合(包含数据库id,sql,数值)当前数据库慢查询TopN
### SkyWalking 指标详解 #### 主要性能指标SkyWalking UI 6.5.0版本中,主要监控视角之一是每分钟请求数(CPM),这是衡量服务负载的重要参数[^1]。 #### SLA与服务可靠性 关于网站服务可用性的评估标准(SLA),其计算基于请求的成功率和失败次数。具体而言,99.9%的服务可用性意味着一年内最多允许8.76小时的停机时间;而达到五个九(99.999%)则表示全年仅能容忍约5.26分钟的中断[^2]。 #### 综合服务质量评价-Apdex分数 Service Apdex用于量化用户体验质量,它是一个介于0到1之间的数值,其中接近1表明大多数用户的体验良好。此度量综合考虑了响应时间和成功率等因素来给出总体评分[^3]。 #### 平均响应延迟 平均响应时间为毫秒级(ms), 它反映了服务器处理单个请求所需的时间长度, 是影响Apdex得分的关键因素之一. ```python def calculate_average_response_time(total_responses, total_duration_ms): """ 计算平均响应时间. 参数: total_responses (int): 总请求数量 total_duration_ms (float): 所有请求耗时之和(以毫秒计) 返回: float: 平均响应时间(ms) """ if not total_responses or not isinstance(total_responses, int) or \ not total_duration_ms or not isinstance(total_duration_ms, (int,float)): raise ValueError("Invalid input parameters") avg_rt = round(total_duration_ms / total_responses, 2) return avg_rt ``` #### 请求成功率 Successful Rate显示的是成功完成的比例,通常作为百分比呈现。高成功率意味着较少错误发生并提高了整体系统的稳定性。 #### 负载情况 Services Load展示了不同协议下实际发生的流量强度,比如HTTP/gRPC/RPC类别的CPM以及TCP层面的PPM。这有助于识别潜在瓶颈位置以便优化资源分配策略。 #### 响应时间分布 Service Response Time Percentile提供了特定时间段内的性能概况,例如,在某时刻点上99%以上的查询都能在一秒钟之内得到答复,则说明绝大多数情况下系统表现优异。
评论 3
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值