변수 | 평균 | 합계 |
---|---|---|
PassengerId Survived Pclass Age Parch Fare | 446.00 0.38 2.31 29.76 0.38 32.20 | 397386.00 342.00 2057.00 26515.17 340.00 28693.95 |
/*
개발환경 : SAS University Edition
날짜 : 2017. 3. 8
*/
(2) PROC SQL로 새로운 테이블 만들기
FILENAME REFFILE '/folders/myfolders/titanic.csv'; PROC IMPORT DATAFILE=REFFILE DBMS=CSV OUT=WORK.titanic; GETNAMES=YES; RUN; PROC SQL; create table titanic_male as SELECT * FROM work.titanic WHERE sex = 'male' ; RUN;
PROC SQL 입력후 SQL 문으로 새로운 테이블을 생성하는 문장을 넣으면 된다. 위처럼 입력하면 타이타닉 예제에서 sex가 male인 row들만 모아서 새로운 테이블을 만든다. 컬럼을 선택하려면 SELECT column1, column2 처럼 넣으면 된다. 위 스크립트를 실행 후에 work 라이브러리에 가보면 titanic_male이라는 이름의 테이블이 새로 생성되었음을 확인할 수 있다.
출처
https://www.tutorialspoint.com/sas/sas_standard_deviation.htm
SAS - 연령 변수를 이용해 새로운 범주형 변수 만들기 (0) | 2017.04.01 |
---|---|
SAS - 주민등록번호에서 나이 추출하기 (0) | 2017.04.01 |
SAS - (4) PROC FREQ 빈도 분석 (0) | 2017.03.13 |
SAS - (3) Standard Deviation 구하기 (0) | 2017.03.08 |
SAS - (1) 산술 평균 구하기 (2) | 2017.03.08 |
/*
개발 환경 : SAS University Edition
날짜 : 2017/3/8
*/
SAS 에서 데이터의 산술 평균은 PROC MEANS 를 통해 구할 수 있다. 예제 데이터셋으로는 titanic 데이터셋을 사용하였다.
데이터 읽기
/* 소스 파일: titanic.csv */ /* 소스 경로: /folders/myfolders */ /* 코드 생성일: 17. 3. 7. 오후 3:35 */ FILENAME REFFILE '/folders/myfolders/titanic.csv'; PROC IMPORT DATAFILE=REFFILE DBMS=CSV OUT=WORK.titanic; GETNAMES=YES; RUN;
모든 변수의 평균 구하기
/* 모든 변수의 평균, 합 출력 */ PROC MEANS DATA = WORK.titanic Mean SUM MAXDEC=2; RUN;
위와 같이 하면 모든 변수의 Mean과 Sum을 구한다. MAXDEC는 Max Decimal의 약자로 소숫점 둘째자리까지 출력하라는 의미이다.
MEANS 프로시저
변수 | 평균 | 합계 |
---|---|---|
PassengerId Survived Pclass Age Parch Fare | 446.00 0.38 2.31 29.76 0.38 32.20 | 397386.00 342.00 2057.00 26515.17 340.00 28693.95 |
특정 변수의 평균 구하기
특정 변수의 평균만 구하고 싶을 때는 VAR 키워드에 지정해준다.
/* 특정 변수의 평균, 합 출력 */ PROC MEANS DATA = WORK.titanic Mean SUM MAXDEC=2; VAR age; RUN;
MEANS 프로시저
분석 변수 : Age | |
---|---|
평균 | 합계 |
29.76 | 26515.17 |
그룹별로 평균 구하기
/* 특정 변수의 평균, 합 출력 */
PROC MEANS DATA = WORK.titanic Mean SUM MAXDEC=2; VAR age; CLASS sex; RUN;
MEANS 프로시저
분석 변수 : Age | |||
---|---|---|---|
Sex | 관측값 수 | 평균 | 합계 |
female | 314 | 28.27 | 8876.00 |
male | 577 | 30.57 | 17639.17 |
참고
SAS - 연령 변수를 이용해 새로운 범주형 변수 만들기 (0) | 2017.04.01 |
---|---|
SAS - 주민등록번호에서 나이 추출하기 (0) | 2017.04.01 |
SAS - (4) PROC FREQ 빈도 분석 (0) | 2017.03.13 |
SAS - (3) Standard Deviation 구하기 (0) | 2017.03.08 |
SAS - (2) PROC SQL로 새로운 테이블 만들기 (0) | 2017.03.08 |