
监控
zl1zl2zl3
这个作者很懒,什么都没留下…
展开
-
监控系统选型,一篇全搞定!
之前,写过几篇有关线上问题排查的文章,文中附带了一些监控图,有些读者对此很感兴趣,问我监控系统选型上有没有好的建议?目前我所经历的几家公司,监控系统都是自研的。其实业界有很多优秀的开源产品可供选择,能满足绝大部分的监控需求,如果能从中选择一款满足企业当下的诉求,显然最省时省力。这篇文章,我将对监控体系的基础知识、原理和架构做一次系统性整理,同时还会对几款最常用的开源监控产品做下介绍,以便大家选型时参考。内容包括如下三部分: 必知必会的监控基础知识 主流监控系统介绍转载 2020-08-19 21:17:01 · 478 阅读 · 1 评论 -
最全 Prometheus 踩坑集锦
监控系统的历史悠久,是一个很成熟的方向,而 Prometheus 作为新生代的开源监控系统,慢慢成为了云原生体系的事实标准,也证明了其设计很受欢迎。本文主要分享在 Prometheus 实践中遇到的一些问题和思考,如果你对 Kubernetes 监控体系或 Prometheus 的设计还不太了解,可以先看下容器监控系列[1]。几点原则 监控是基础设施,目的是为了解决问题,不要只朝着大而全去做,尤其是不必要的指标采集,浪费人力和存储资源(To B商业产品例外)。 需要处理的告警才发出来.转载 2020-08-15 10:10:35 · 9071 阅读 · 2 评论 -
彻底吃透监控系统,就这一篇!
由于业务的多样性,这些平台和系统也变得异常的复杂。如何对其进行监控和维护是我们 IT 人需要面对的重要问题。就在这样一个纷繁复杂地环境下,监控系统粉墨登场了。今天,我们会对 IT 监控系统进行介绍,包括其功能,分类,分层;同时也会介绍几款流行的监控平台。监控系统的功能在 IT 运维过程中,常遇到这样的情况: 某个业务模块出现问题,运维人员并不知道,发现的时候问题已经很严重了。 系统出现瓶颈了,CPU 占用持续升高,内存不足,磁盘被写满;网络请求突增,超出网关承受的压力。 .转载 2020-08-13 14:41:04 · 2233 阅读 · 1 评论 -
Spring Boot 项目如何做性能监控?
来源:zhaoyh's blog,http://zhaoyh.com.cn/Spring Boot特别适合团队构建各种可快速迭代的微服务,同时为了减少程序本身监控系统的开发量,Spring Boot提供了 actuator 模块,可以很方便的对你的 Spring Boot 程序做监控。1. actuator接口说明Spring Boot 应用中加入监控很简单,只需要在pom.xml文件中加入以下依赖:<dependency><groupId>org.sp...转载 2020-07-16 19:56:26 · 2088 阅读 · 0 评论 -
Redis性能监控指标汇总
监控指标 性能指标:Performance 内存指标: Memory 基本活动指标:Basic activity 持久性指标: Persistence 错误指标:Error 性能指标:PerformanceName Description latency Redis响应一个请求的时间 instantaneous_ops_per_sec 平均每秒处理请求总数 hi rate(calculated) 缓存命中率(计算出来的转载 2020-06-30 09:18:20 · 747 阅读 · 0 评论 -
监控神器Prometheus用不对,也就是把新手村的剑
监控系统的历史悠久,是一个很成熟的方向,而 Prometheus 作为新生代的开源监控系统,慢慢成为了云原生体系的事实标准,也证明了其设计很受欢迎。本文主要分享在 Prometheus 实践中遇到的一些问题和思考,如果你对 K8S 监控体系或 Prometheus 的设计还不太了解,可以先看下容器监控系列。容器监控系列:https://yasongxu.gitbook.io/container-monitor/几点原则 监控是基础设施,目的是为了解决问题,不要只朝着大而全去做,尤其是.转载 2020-05-17 10:38:07 · 1785 阅读 · 0 评论 -
给你的SpringBoot做埋点监控--JVM应用度量框架Micrometer
作者:云扬四海cnblogs.com/rolandlee/p/11343848.htmlJVM应用度量框架Micrometer实战前提spring-actuator做度量统计收集,使用Prometheus(普罗米修斯)进行数据收集,Grafana(增强ui)进行数据展示,用于监控生成环境机器的性能指标和业务数据指标。一般,我们叫这样的操作为”埋点”。SpringBoot中的依赖...转载 2020-04-07 21:29:32 · 1322 阅读 · 0 评论 -
陆金所 CAT 优化实践
1 背景CAT 介绍CAT (Central Application Tracking)是一个实时监控系统,由美团点评开发并开源,定位于后端应用监控。应用集成客户端的方式上报中间件和业务数据,支持 Transaction、Event 和 Heartbeat 等数据类型 Metrics 报表,也支持调用链路 Trace,对于发现和定位应用问题有很大帮助。CAT 服务端也可以认为是一个 L...转载 2020-03-18 21:40:47 · 718 阅读 · 0 评论 -
Kubernetes大集群怎么管?基于监控的弹性伸缩方法
导语: 我们通常使用Prometheus来对Kubernetes运行情况进行监控。并根据监控数据来扩容或者缩容。通常的扩/缩容都是根据内存或者CPU的使用,但是很多时候我们扩/缩容的依据通常是业务监控指标。如何根据业务监控指标来进行扩/缩容,本文作者给出了很优雅的方式。Kubernetes自动弹性伸缩自动弹性伸缩是一种基于资源使用情况自动弹性伸缩工作负载的方法。Kubernetes的...转载 2018-12-01 21:10:43 · 657 阅读 · 0 评论 -
随手记统一监控平台Focus设计解析
应用监控是多数互联网公司最重要的基础设施之一,其意义不仅在于可以帮助开发人员应对分布式环境下的 Trouble Shooting 和性能管理难题,更是系统可用性的第一步。Focus 是由随手记研发的统一应用监控平台,承载了随手旗下随手记、卡牛两款产品数百个服务的应用监控任务。本文将对 Focus 的设计思路和关键实现进行剖析。(本文根据 2018 年 10 月张越在 QCon 上海站的演讲整...转载 2018-11-26 09:41:05 · 1334 阅读 · 0 评论 -
【SpringBoot专题】监控健康状况
前言想一想,我们以前是如何监控一个Java应用的监控状况的?一般而言,我们会在Linux服务器上通过一些命令,比如通过jstat来统计堆内存的使用情况/垃圾回收的情况,通过jstack分析Java线程状态等。那么对于SpringBoot而言,在监控应用健康状况上,提供了更加简便以及可视化的工具给我们使用,本文就给大家分享这方面的知识~ 监控插件:actuator引入actuator...转载 2018-11-24 00:37:08 · 1087 阅读 · 1 评论 -
Prometheus 初探
首先-什么是 TSDB (Time Series Database):我们可以简单的理解为.一个优化后用来处理时间序列数据的软件,并且数据中的数组是由时间进行索引的.时间序列数据库的特点:大部分时间都是写入操作 写入操作几乎是顺序添加;大多数时候数据到达后都以时间排序. 写操作很少写入很久之前的数据,也很少更新数据.大多数情况在数据被采集到数秒或者数分钟后就会被写入数据库. 删除...原创 2017-07-04 16:38:25 · 30010 阅读 · 1 评论