监控报警系统的调研
一、组件
二、功能列表
数据采集:接口、队列、订阅事件等信息的采集
Td-agent:file
Bosun支持api
数据存储:时序数据库
数据展示:dashboard的展示
数据预警:预警规则的定义,如通知用户,监控的资源,通知方式等
三、技术
1.数据采集
Telegraf,支持的监控项有:java应用、http请求、日志、exec脚本、其它常见应用(mongodb,mysql,rabbitmq,redis,nginx,postgresql等)
支持的写入介质: influxdb、rabbitmq、aws cloudwatch、elasticsearch、file、graphite、graylog、kafka、mqtt、opentsdb、prometheus、socket_writer、tcp、udp
2.数据存储
采用时序数据库存储
Influxdb(InfluxDB集群化要商业版)
Opentsdb是一个基于HBase、分布式、高可用、可伸缩的时间序列数据库
(严重依赖Hbase)
Es(不是严格的时序数据库