收集哪些数据? 收集数据是为了及时对潜在问题生成自动报警,并最少化假警报,迅速investigate效能问题。 收集数据的成本很低,但如果没有数据,当你需要的时候,代价就会高昂。你应该instrument everything,收集所有有用的数据。 收集的数据类型主要分为两种:metrics 和 events。 Tagging 用来filter,或者group 收集数据应该使得数据1)易懂 2)粒度尽可能细 3)用tag分类 4)long-lived