父文章 稳定性之 监控,报警,定位 架构师该做什么. 偏数据分析视角,智能定位. 2/5/15 of 安全生产_个人渣记录仅为自己搜索用的博客-优快云博客
投屏问题如何监控.
边界
1.用户行为是边界 2.代码作为两个边界之间的执行体,就是监控的对象.
埋点图
任何埋点都整理成图,对应的比例关系在统计层面都是差不多不变的.
基于埋点图的统计监控:
如果某个埋点数低了,那么就要从哪些没有了下游埋点的埋点中去找对应的问题,假设A埋点后肯定是B埋点. A,B埋点之间只有代码. 那么逻辑上A埋点和B埋点的数量应该是一致的. 或者说除去某些业务异常外,A,B埋点数量是一致的. 故存在A成功-B和A失败-X埋点. 需要对A打标.
异常case定位
怎么找case,这个时候就需要一个唯一标识了. 一般这个就是uid加单位分钟. 通过01分钟的A,01-02分钟内都没有出现过B.这些A筛选出来就是可用于case分析的例子.
Q: 如果有正常情况就是没有B,那么定位就会非常难.
A: 不会除非是有用户的行为没有埋点, 不然肯定是完备的
跨用户的埋点串联
如果类似投屏垮了用户和智能设备,需要把用户uid和设备uid关联起来,也就是需要一个sessionId. 不然无法找到那些缺失了B埋点的A埋点,<