微服务业务监控和行为分析怎么做？试试日志埋点

最新推荐文章于 2025-04-07 00:38:18 发布

转载最新推荐文章于 2025-04-07 00:38:18 发布 · 1.1k 阅读

7 ·

CC 4.0 BY-SA版权

原文链接：https://my.oschina.net/zlt2000/blog/3128254

file

一、说明

互联网公司一般都会有专门的数据团队对公司的一些业务指标负责；为了拿到这些基本的业务指标，一般也要工程团队去配合做一些数据采集工作，于是埋点诞生了。

埋点的方式有很多种，本文主要介绍 日志埋点 这种方式以及实现思路和案例。

日志埋点 就是通过程序打印 log 日志的方式进行业务/行为数据的记录

二、总体架构

file

通过 日志埋点 来实现业务监控和行为分析主要需要以下4个步骤

数据生成(埋点)
数据收集
数据解析(结构化)
数据落盘
数据使用(展示/分析)

三、方案说明

3.1. 数据生成

日志数据的生成直接使用 Logback 等日志框架就可以了，可以自己封装公共方法、aop、注解等方式来生成指定的埋点日志

但是为了便于后面的数据解析，日志数据需要规范先行

所有的埋点日志必需约定好统一的格式，例如：{时间}|{来源}|{对象id}|{类型}|{对象属性(以&分割)}

按上面的格式生成的日志为： 2019-11-07 10:32:01|api-gateway|1|request-statistics|ip=171.221.203.106&browser=CHROME&operatingSystem=WINDOWS_10

避免埋点的日志文件和系统本身输出的日志混淆

埋点的日志输出的目录、文件等需要和应用本身的日志分离，通过 Logback 的配置就能实现

埋点案例

file

生成日志

file

网关埋点用户请求

3.2. 数据收集

关于日志数据的收集可选择的中间件比较多，除了图中的 FileBeat 之外还有 Flume、Fluentd、rsyslog 等；需要每台服务器都部署一个收集中间件。

每台服务器部署一个就行了，就算一台服务器中启了多个微服务也是可以一齐收集

PS：日志收集后面的 消息队列 并不是必需的可以去掉，但是增加 消息队列 后有以下两个优点

削峰填谷：减轻后面日志解析的压力
数据共享：日志数据除了提供给日志系统之外，可以增加消费端的同时提供给其他地方使用，如流计算等

3.3. 数据解析

使用 Logstash 的grok表达式解析日志数据并结构化，以上面的日志数据为例

2019-11-07 10:32:01|api-gateway|1|request-statistics|ip=171.221.203.106&browser=CHROME&operatingSystem=WINDOWS_10

结构化后的日志数据为：

{
	timestamp: '2019-11-07 10:32:01',
	appName: 'api-gateway',
	resouceid: '1',
	type: 'request-statistics',
	ip: '171.221.203.106',
	browser: 'CHROME',
	operatingSystem: 'WINDOWS_10'
}

3.4. 数据落盘

通过 Logstash 能自动创建 Elasticsearch 索引并以天为单位分片 file

可以通过索引模板来指定每个字段的类型和分词器等属性

3.5. 数据使用

日志数据落盘到 Elasticsearch 后，就可以通过聚合查询等方式实时显示监控数据或者分析日志数据

监控案例

file

聚合查询逻辑可参考 https://gitee.com/zlt2000/microservices-platform

四、总结

日志埋点 只是其中一种埋点手段而已，优点是系统无入侵且灵活；日志收集、解析、落盘等都可以灵活搭配选择不同的中间件，并且不需要修改源系统的代码；并且可以方便对接其他分析平台(例如: 大数据平台)

PS：业务监控是否可以不做日志埋点，直接查询业务的数据库呢？(不建议这样做)

使用日志埋点能实现监控数据与业务数据分离，监控平台不会影响或增加业务数据库的压力
使用日志埋点能方便实现实时业务数据预警

举个栗子：日志收集后面添加流计算中间件，计算某个时间窗口内优惠卷日志的数量或者金额大于某个阀值，则发出预警

进QQ群（779809018）免费领取学习资源，疑难问题解答。同时欢迎大家关注我的微信公众号：代码帮，免费领取学习资源和学习每天不定时推送的技术性文章。

本公众号将秉持活到老学到老学习无休止的交流分享开源精神，汇聚于互联网和个人学习工作的精华干货知识，一切来于互联网，反馈回互联网。
目前研究领域：大数据、机器学习、深度学习、人工智能、数据挖掘、数据分析。语言涉及：Java、Scala、Python、Shell、Linux等。同时还涉及平常所使用的手机、电脑和互联网上的使用技巧、问题和实用软件破解。只要你一直关注和呆在群里，每天必须有收获,讨论和答疑QQ群：大数据和人工智能总群(779809018)微信公众号（代码帮）每天分享最新IT、大数据和人工智能新技术。