举例
例1
有 Excel 文件 Book1.xlsx,部分数据如下所示:
| id | name |
| 1001 | jack |
| 1002 | bob |
| 1002 | bob |
| 1003 | jerry |
| 1003 | jerry |
| 1004 | alice |
| 1004 | |
| 1004 | aaa |
| 1005 | tom |
| 1006 |
去除 id 和 name 都重复的数据,若相同 id 存在非空 name,则 name 为空的数据也删除。结果如下:
| id |
本文通过两个示例详细介绍了如何使用SPL脚本进行多列数据去重操作。在例1中,针对Excel文件,脚本按id分组并删除特定条件下的重复name记录;在例2中,脚本则实现了列序无关的完全数据去重,保留每个唯一数据组的第一个记录。
有 Excel 文件 Book1.xlsx,部分数据如下所示:
| id | name |
| 1001 | jack |
| 1002 | bob |
| 1002 | bob |
| 1003 | jerry |
| 1003 | jerry |
| 1004 | alice |
| 1004 | |
| 1004 | aaa |
| 1005 | tom |
| 1006 |
去除 id 和 name 都重复的数据,若相同 id 存在非空 name,则 name 为空的数据也删除。结果如下:
| id |

被折叠的 条评论
为什么被折叠?