前言
分布式系统的执行环境往往是异常复杂的,很多情况涉及到多节点间的消息通信。相比较于单节点系统而言,分布式系统在问题追踪,排查方面显然也复杂很多。那么这个时候,在分布式系统中,增加哪些类型的日志数据,来帮助我们发现和定位问题呢?答案就是我们今天将要阐述的审计日志(Audit log)。
审计日志的概念
很多人可能在想这样一个问题:同样是日志,审计日志和普通的日志,区别在于哪里呢?
审计日志,英文名为audit log,而audit这个单词的中文意思为“查账”,说明这些信息是具有准确记录的,并且会有规定的(账单)格式。也就是说,审计日志它会明确记录过往的“操作流水”,并且每天记录格式规则统一。这样能够方便地帮助我们分析这些日志。在分布式系统中,这些“操作流水”其实就是系统中每一次的操作行为。
下面笔者截取了HDFS的audit日志做为例子,如下:
2018-11-09 16:08:37,209 INFO FSNamesystem.audit: allowed=true ugi=hdfs (auth:SIMPLE) ip=xx.xx.xx.xx cmd=rename src=/tmp dst=/tmp2 perm=hdfs:hdfs:rw-r–r-- proto=rpc
2018-11-09 16:08:37,209 INFO FSNamesystem.audit: allowed=true ugi=hdfs (auth:SIMPLE) ip=/xx.xx.xx.xx cmd=open src=/data dst=null perm=null proto=rpc
我们可以看到,每天记录都准确地记下了每次操作行为的具体属性信息,因为日志格式非常规则化,我们完全可以将它们做文本处理分析,然后导入到SQL表里进一步进行查询分析。比如可以做“哪个时间段,哪部分操作占比最多”等等类似这样的查询。
审计日志功能类的编写
审计日志说到底它还是一种日志,只是经过人为的加工包装后再输出。所以对于审计日志工具类的开发来说,其实并不是特别难的。主要实现以下几点:
- 定义好消息的统一格式
- 构造出灵活的消息构建模式
- 复用Logger日志实例进行日志打印
第一点,消息格式的定义。这个决定了消息的最终输出内容,这个在开始时是一定要设想好的,哪些属性要必须输出的,哪些是可选的。下面是一个例子:
private static final String MSG_PATTERN =
“user=%s | ip=%s | op=%s %s | ret=%s”;
这里,我们用pattern模式的方法,要比直接字符串append方式组装灵活许多。
在上面的格式里,我们定义了4个属性值。
然后是对于日志消息的构造,这里强调的是灵活性,我们可以用构建者模式来做,示例代码如下:
首先AuditMessage消息对象如下:
/**
* Defines audit message structure.
*/
public class AuditMessage implements Message {
private String message;
private Throwable throwable;
private static final String MSG_PATTERN =
"user=%s | ip=%s | op=%s %s | ret=%s";
...
}
/**
* Builder class for AuditMessage.
*/
public static class Builder {
private Throwable throwable;
private String user;
private String ip;
private String op;
private Map<String, String> params;
private String ret;
public Builder(){
}
public Builder setUser(String usr){
this.user = usr;
return this;
}
public Builder