SAS编程基础-数据集操作

本文介绍了SAS编程中的数据集操作,包括数据的合并(纵向与横向)、数据集排序、数据对比以及查找/去除重复数据。数据合并部分讲解了SET和MERGE语句的应用,排序使用PROC SORT过程,数据对比通过PROC COMPARE实现,查找重复数据则依赖于PROC SORT的nouniquekey和nodupkey选项。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


1、数据的合并

在数据量较大的时候经常会交给不同的人进行录入,这时我们就需要把他们录入的数据合并到一个数据集中,这就是数据合并,分为纵向合并和横向合并。

(1)数据纵向合并

纵向合并的语法是(set语句):

data 数据集;
set 数据集1 数据集2...;
run;

set 后面如果只有一个数据集,相当于对该数据集进行复制;
数据集选项最常用的有两种:
第一种:

set 数据集1(in=临时变量1) 数据集2(in=临时变量2)...;

该语句是对临时变量进行了定义,来自于该数据集的临时变量的值为1,不来自该数据集的临时变量为0(如果不进行额外设置的话,临时变量1、临时变量2是不会显示在数据集中的)具体如下所示:

/*合并数据集  */
DATA DATA01.dsg1;
/* 	SET DATA01.ds1(IN = a) DATA01.ds2(IN = b);*临时变量不会自己写入数据集; */
/* 	ds1 = a; */
/* 	ds2 = b;	 */
*使用IN=的方式来追溯数据来源;
	SET DATA01.ds1 DATA01.ds2(RENAME=(ht = height wt = weight));
/* 使用rename来完成变量的重命名 */
RUN;
DATA DATA01.dsg1c;
	SET DATA01.dsg1;
RUN;

PROC PRINT DATA = DATA01.dsg1c;
RUN;

第二种

set 数据集1(rename=(原名1=新名1)) 数据集2 (rename=(原名2=新名2))...;
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值