需求
处理前:
小明 234小方 235
小明 234
小明 345
处理后
小明 234
小明 345
解决方案1:
awk
'!a[$1]++{s[$1]=$0;b[$1$2]++;next} a[$1]++&&!b[$1$2]++{s[$1]=s[$1]!=""?s[$1]"\n"$0:$0;print s[$1];s[$1]=""}' filename
本文介绍了一种利用awk命令处理文本文件中特定形式的重复项的方法。通过巧妙地使用awk的变量和条件判断,可以有效地从原始数据中筛选并保留唯一的记录。此技巧适用于需要清理数据或处理具有重复字段的数据集的场景。
需求
处理前:
小明 234小明 345
解决方案1:
awk
'!a[$1]++{s[$1]=$0;b[$1$2]++;next} a[$1]++&&!b[$1$2]++{s[$1]=s[$1]!=""?s[$1]"\n"$0:$0;print s[$1];s[$1]=""}' filename
2016

被折叠的 条评论
为什么被折叠?