如果有研究过IIS日志文件的朋友们,可能都知道,每个服务器,甚至每个域名的IIS日志格式可能都不同,这样刚开始接触的朋友就觉得很烦,特别是当我们要自己写IIS日志分析软件的时候更烦恼,因为如果一不小心设置错了,针对固定格式而写的读取文件就不能用了。特别是修改日志设置的时候,由于当日的文件中会存在两个不同的数据格式,读取非常麻烦,下面我把我解决这个烦恼问题的解决方案公开,希望对大家有帮助。
文件格式可能如下:
#Fields: date time cs-method cs-uri-stem cs-uri-query cs-username c-ip cs-version cs(User-Agent) cs(Referer) sc-status sc-bytes
2007
-
11
-
01
00
:
00
:
00
GET /book/product.aspx bookid
=
B10027740 -
66.249.73.134
HTTP/
1.1
- -
200
26124
#Fields: date time cs-uri-stem cs-uri-query cs-username c-ip cs-version cs(User-Agent) cs(Referer) sc-status
2007
-
11
-
01
00
:
00
:
00
/book/product.aspx bookid
=
B10027740 -
66.249.73.134
HTTP/
1.1
- -
200
#Fields代表格式符,对应到下一个#Fields之前全部使用这种格式读取
也就是说 第2行使用第1行的格式,第4行使用第2行的格式,我们尝试读取第四行中的/book/product.aspx,注意1、3行定义了cs-uri-stem为这个数据的格式 ,比较1、3行,1行比3行多了cs-method 也就是Form中对应的GET/POST
由于顺序可能不同,出现的先后也可能不同,所以建立一个索引类,对应信息类的字段。代码如下
/**/
/// <summary>
/// 信息类
/// </summary>

本文介绍了如何处理IIS日志文件的不同格式问题,特别是当日志格式变化时如何进行有效读取。通过创建一个索引类来对应信息字段,实现对IIS日志的灵活读取,解决了因格式变化导致的读取困难。这种方法适用于需要自定义分析IIS日志的开发者。
最低0.47元/天 解锁文章
538

被折叠的 条评论
为什么被折叠?



