SAS 9.4를 사용하여 머신러닝 모델을 적용한 분석을 진행해본다.

1. 추가 데이터 전처리

이제 환경을 약간 바꿔 SAS 9.4에서 작업을 해보도록 하겠습니다. 새로운 환경에서 실행했으니 복습하는 차원에서 데이터를 읽어 오는 것부터 다시 해보도록 하겠습니다.

1) 데이터 읽어오기

1-1 라이브러리 지정

타이타닉 데이터가 있는 폴더를 찾아 폴더의 주소를 입력하고 Libname을 사용하여 라이브러리 지정을 합니다. 지정을 하게 되면 다음과 같이 Titan 라이브러리가 생기게 됩니다.

libname titan "C:\\Users\\help\\Downloads\\titanic";

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/0f9cdae0-37a4-4149-b6ea-a045da7c2040/Untitled.png

1-2 데이터 가져오기

Train 데이터

앞서 배운 PROC IMPORT를 사용하여 CSV파일로 되어있는 데이터셋을 불러옵시다. 실행 후 Titan 라이브러리 안에 Train SAS 파일이 생성된것을 확인할 수 있습니다.

PROC IMPORT DATAFILE = "C:\\Users\\help\\Downloads\\titanic\\TRAIN.CSV"
DBMS = CSV
OUT = TITAN.TRAIN
REPLACE;
RUN;

Test 데이터

테스트 데이터도 동일하게 불러옵시다. 실행 후 Test SAS 파일이 생성된것을 확인 할 수 있습니다.

PROC IMPORT DATAFILE = "C:\\Users\\help\\Downloads\\titanic\\TEST.CSV"
DBMS = CSV
OUT = TITAN.TEST
REPLACE;
RUN;