julia coding story

SAS 기본 쿼리 및 데이터 처리 기초(1) - 데이터 탐색 방법(DATA, PROC) 본문

카테고리 없음

SAS 기본 쿼리 및 데이터 처리 기초(1) - 데이터 탐색 방법(DATA, PROC)

julia-biolat 2023. 1. 10. 17:01
728x90

1. 데이터 탐색

1.1 기본 쿼리 구조 [DATA step]

- 시작은 DATA로 

- 각 명령문의 끝에 세미콜론(;) 입력

- 종료는 RUN

DATA output_data; *시작은 DATA로;
	SET input_data;
	variable = expression;
	IF expression THEN statement;
	ELSE IF expression THEN statement;
	WHERE expression;
	KEEP variable;
	RUN; *종료는 RUN;

1.2 기본 쿼리 구조 [PROC step]

- 시작은 PROC

- 각 명령의 끝에 세미콜론(;) 입력

- 종료는 RUN

PROC sort data=cholest;
	VAR var1 var2;
RUN;

1.3 전체 데이터 가져오기

- 출력하는 데이터셋 이름 입력

- 입력하는 데이터셋 이름 입력

DATA 출력하는 데이터셋 이름;
	SET 입력하는 데이터셋 이름;
RUN;

1.4 부분 데이터 가져오기

-  FIRSTOBS : 가져오기 원하는 시작 데이터 개체

- OBS : 가져오기 원하는 마지막 데이터 개체

DATA 출력하는 데이터셋 이름;
	SET 입력하는 데이터셋 이름(FIRSTOBS== 11 OBS=30);
RUN;

1.5 부분 변수 가져오기

- KEEP : 데이터셋에 포함될 변수 지정

- DROP : 데이터셋에 포함되지 않을 변수 지정

DATA 출력하는 데이터셋 이름;
	SET 입력하는 데이터셋 이름;
	KEEP var1 var2;
RUN;

Q. 문제 : TRAINING 라이브러리에 NPS200데이터를 불러와서 WORK 라이브러리에 C2_2_practice 파일로 저장하기 (단, 21 ~ 50번째의 데이터의 SPEC_ID_SNO, JID, RECU_FR_DD, RECU_TO_DD 변수만 가져오기)

DATA C2_2_practice;
	SET TRAINING.NPS200(FIROBS == 21 OBS == 50);
	VAR SPEC_ID JID RECU_FR_DD RECU_TO_DD;
RUN

1.6 변수 특성 확인하기 [proc contents]

PROC CONTENTS DATA= data_set
<options>;
RUN;

PROC CONTENTS DATA = TRAINING.NPS200;
RUN;

PROC CONTENTS DATA = TRAINING.NPS200;
order = varnum;
RUN;