1、删除主键有重复的行 nodupkey
只要BY主键的值相等,不管其他值是否相等,一律删除
data test3;
input id1 $ id2 $ extra ;
cards;
aa ab 3
aa ab 3
aa ab 2
aa ab 1
;
proc sort nodupkey data=test3;
by id1 id2;
run;
结果:
Obs id1 id2 extra
1 aa ab 3
2、删除主键有重复的行 nodup
BY主键的值相等,但其他值不相等,不删除,只删除相邻的,完全相同的行。
data test2;
input id1 $ id2 $ extra ;
cards;
aa ab 3
aa ab 3
aa ab 2
aa ab 1
;
proc sort nodup data=test2;
by id1 id2;
run;
options nocenter;
proc print data=test2;
run;
结果是:
Obs id1 id2 extra
1 aa ab 3
2 aa ab 2
3 aa ab 1
本文详细介绍使用SAS进行数据去重的两种方法:nodupkey和nodup。nodupkey用于删除所有主键重复的行,而nodup仅删除完全相同的相邻重复行。通过示例展示如何操作。
1万+

被折叠的 条评论
为什么被折叠?



