[夜莺监控系列1]夜莺介绍

image.png

 

1 基础介绍

  • 夜莺监控( Nightingale )是一款国产、开源云原生监控分析系统,采用 All-In-One 的设计,集数据采集、可视化、监控告警、数据分析于一体。于 2020 年 3 月 20 日,在 github 上发布 v1 版本,已累计迭代 60 多个版本。从 v5 版本开始与 Prometheus、VictoriaMetrics、Grafana、Telegraf、Datadog 等生态紧密协同集成,提供开箱即用的企业级监控分析和告警能力,已有众多企业选择将 Prometheus + AlertManager + Grafana 的组合方案升级为使用夜莺监控。

  • 夜莺监控,由滴滴开发和开源,并于 2022 年 5 月 11 日,捐赠予中国计算机学会开源发展委员会(CCF ODC),为 CCF ODC 成立后接受捐赠的第一个开源项目。夜莺监控的核心开发团队,也是Open-Falcon项目原核心研发人员。

  • 官网:

  • 名词解释:

    • n9e:即nightingale,中间有9个字母,所以叫n9e,类似k8s的叫法。
    • 快猫星云(北京快猫星云科技有限公司): 是一家云原生智能运维科技公司,成立于2021年10月,创始团队均来自阿里、百度、滴滴等互联网公司。快猫技术团队也是开源监控系统“Open-Falcon”和“夜莺监控”的创始团队。快猫星云打造的云原生监控分析平台“Flashcat平台”,旨在解决云原生架构、混合云架构下统一监控难、故障定位慢的问题。

2 架构介绍

2.1 基础结构

image.png

  • 从上图可以看出,左侧为收集器,中间为夜莺的前后端服务,右侧为时序数据库。

  • 夜莺本身不提供收集器和时序数据库,所以可以使用Categraf/Exporters之类的采集器接入夜莺,然后存储到Prometheus/VictoriaMetrics/Thanos等TSDB(时序数据库)中。

  • TSDB社区推荐使用VictoriaMetrics,特别是单机版推荐这个DB,原因是可以承担上每秒数据点数上百万的写入(详见:victoriametrics介绍),单机性能比prometheus好。

  • 采集器推荐使用Categraf。

2.2 服务架构

image.png

从上图可以看出:

  1. 通过采集器采集数据,然后将数据上报给n9e-server(夜莺的server端),并将数据写入到TSDB中。

    • 这里的Load Balance可以是k8s的service。也可以是其他(4层)代理(如:ipvs)。
  2. MySQL的作用:将用户的个人信息、相关配置存储到mysql中。

  3. Redis的作用:n9e-server会定时发送心跳信息到redis中,以确保对应的n9e-server是存活状态。还保存了jwt cache。

  4. n9e-web的作用: 就是夜莺监控的前端页面,支持监控对象、监控看图、告警管理、告警自愈、人员组织等功能,如下图:

image.png

  1. 正常来说一个监控集群使用一个TSDB就够了。但如有特殊情况,如在多个城市都有机房,那么就可以考虑使用集群版本的TSDB(如victorametrics3、m3db、thanos等),那么可以安装多个n9e-server,让n9e-serverTSDB在一起(如都安装到同一个机房),但同一个机房的n9e-server的/etc/server.confClusterName必须相同(其次采集器的配置也要修改的),与其他城市ClusterName的不同。这样相同ClusterName的n9e-server会被看成一个集群,会读取相同的数据库。而在n9e-web端,通过不同的ClusterName来识别不同的数据源。具体如下图示例:

image.png

2.3 部署架构

  • Server端: Prometheus + MySQL + Redis + n9e-server + n9e-webapi

  • 采集端:categraf + 其他exporter

3 代码信息

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值