SAS数据处理基础与实用技巧
引言
在医药行业的数据处理领域,SAS(Statistical Analysis System)是一款强大且应用广泛的工具。对于刚踏入这个行业从事数据工作的新人来说,掌握常用的SAS语句和函数是开启高效工作的关键。接下来,我将分享一些在日常工作中频繁使用的SAS知识,助力大家快速上手。
一、数据读取与导入
1. 读取外部数据文件
在医药行业,我们常常需要处理来自各种数据源的数据,如CSV、Excel文件等。
- 读取CSV文件:
data mydata;
infile 'C:\data\medical_data.csv' delimiter=',' missover firstobs=2;
input id patient_name $ age gender $ diagnosis $;
run;
解释:infile
语句指定了数据文件的路径和分隔符,missever
选项确保在读取数据时遇到不完整的行不会报错,firstobs = 2
表示从第二行开始读取数据(假设第一行为表头)。input
语句定义了数据集中变量的名称和类型,$
表示字符型变量。
- 读取Excel文件:
首先需要使用PROC IMPORT
过程。
proc import datafile='C:\data\medical_excel.xlsx'
out=mydata
dbms=xlsx replace;
sheet='Sheet1';
run;
解释:PROC IMPORT
是专门用于导入外部数据的过程,datafile
指定Excel文件路径,out
指定输出数据集的名称,dbms=xlsx
表示导入的是Excel文件,replace
表示如果存在同名数据集则覆盖,sheet
指定要读取的工作表名称。
2. 从数据库中读取数据
如果数据存储在数据库中,如Oracle、SQL Server等,SAS也提供了相应的连接和读取方法。
- 以连接Or