通过shell取多条重复数据的最后一条

这篇博客介绍了如何使用Shell脚本来处理日志文件,通过取出特定列并去重,确保每条记录只保留最后一行。脚本首先获取日志文件的最后行号,然后循环处理每一行,提取第六列和第七列,追加到临时文件。接着,创建新文件存储最终结果,并遍历临时文件,判断记录是否已存在于新文件中。如果存在,则删除旧记录,插入最新数据;如果不存在,则直接插入。测试结果显示脚本能够正确保留每条ID的最后出现的记录。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

任务说明:日志文件中存在多条记录,现要求取出文件中的某两列,而且是去重,取最新的一条记录(就是取这个ID最后出现的那一行的那两列)


脚本代码如下:

#shell声明

#!/bin/bash

#获取最后一行的行号

line_desc_num=`awk 'END{print NR}' log.txt`

#循环每一行,从第一行开始

for i in $line_desc_num

#进入循环

do

#取出这一行的第六列和第七列,用_隔开,并追加到一个新文件中

    output=`cat log.txt |awk -v bl=$i  -F'|' '{print $6"_"$7}'`
    echo "$output" >> /tmp/cs

#结束循环

done

#创建新文件来存储最终结果

touch newfile


#查看cs文件存为变量

all_text=`cat /tmp/cs`

#循环每一行

for k in $all_text

#开始循环

do

#取出id

  id=`echo $k|awk -F'_' '{print $1}'`

#判断这个id有没有在newfile中

  cat /tmp/newfile|grep $id >> /dev/null

#如果在$?返回的是0

if [ $? == 0 ];then

#取出这个id的行号

    line_num=`cat /tmp/newfile|grep -n "$i

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值