比较两个日志中相同的uid(做七日留存)

本文介绍了如何利用awk、sort和uniq等命令对日志文件进行处理,包括提取特定字段、排序和去重,进而进行日期留存分析。详细步骤包括使用awk提取uid、ip等信息,通过sort对数据排序,再用uniq去除重复行,并将结果输出到文件中。同时,展示了如何基于相邻几天的日志文件进行日期留存分析,从而得出用户留存率。

先通过awk处理日志,取得login相关的字段(例子中命令$11为uid的字段,同理也可以得到ip,如果log_server-2013-07-19.log这个日志文件中有记录的话)

然后通过sort -n排序

然后通过uniq去掉相同的行

输出到结果文件中:

awk 'BEGIN{FS="|"} /log_player/&&/login/ {print $11}' log_server-2013-07-19.log |sort -n |uniq >7_19.txt

最后得到一系列7_20,7_21等结果文件

要做几日留存就比较相邻几天的文件

例如:得到七日留存

comm -12 7_19.txt 7_25.txt >7_19_to_7_25.txt

得到的7_19_to_7_25.txt就是七日留存的id了,看留存率,只需要比较7_19.txt和7_19_to_7_25.txt的行数就可以得出了

转载于:https://www.cnblogs.com/qooweds/p/4032856.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值