julia coding story
SAS 기본 쿼리 및 데이터 처리 기초(1) - 데이터 탐색 방법(DATA, PROC) 본문
728x90
1. 데이터 탐색
1.1 기본 쿼리 구조 [DATA step]
- 시작은 DATA로
- 각 명령문의 끝에 세미콜론(;) 입력
- 종료는 RUN
DATA output_data; *시작은 DATA로;
SET input_data;
variable = expression;
IF expression THEN statement;
ELSE IF expression THEN statement;
WHERE expression;
KEEP variable;
RUN; *종료는 RUN;
1.2 기본 쿼리 구조 [PROC step]
- 시작은 PROC
- 각 명령의 끝에 세미콜론(;) 입력
- 종료는 RUN
PROC sort data=cholest;
VAR var1 var2;
RUN;
1.3 전체 데이터 가져오기
- 출력하는 데이터셋 이름 입력
- 입력하는 데이터셋 이름 입력
DATA 출력하는 데이터셋 이름;
SET 입력하는 데이터셋 이름;
RUN;
1.4 부분 데이터 가져오기
- FIRSTOBS : 가져오기 원하는 시작 데이터 개체
- OBS : 가져오기 원하는 마지막 데이터 개체
DATA 출력하는 데이터셋 이름;
SET 입력하는 데이터셋 이름(FIRSTOBS== 11 OBS=30);
RUN;
1.5 부분 변수 가져오기
- KEEP : 데이터셋에 포함될 변수 지정
- DROP : 데이터셋에 포함되지 않을 변수 지정
DATA 출력하는 데이터셋 이름;
SET 입력하는 데이터셋 이름;
KEEP var1 var2;
RUN;
Q. 문제 : TRAINING 라이브러리에 NPS200데이터를 불러와서 WORK 라이브러리에 C2_2_practice 파일로 저장하기 (단, 21 ~ 50번째의 데이터의 SPEC_ID_SNO, JID, RECU_FR_DD, RECU_TO_DD 변수만 가져오기)
DATA C2_2_practice;
SET TRAINING.NPS200(FIROBS == 21 OBS == 50);
VAR SPEC_ID JID RECU_FR_DD RECU_TO_DD;
RUN
1.6 변수 특성 확인하기 [proc contents]
PROC CONTENTS DATA= data_set
<options>;
RUN;
PROC CONTENTS DATA = TRAINING.NPS200;
RUN;
PROC CONTENTS DATA = TRAINING.NPS200;
order = varnum;
RUN;