변수 | 평균 | 합계 |
---|---|---|
PassengerId Survived Pclass Age Parch Fare | 446.00 0.38 2.31 29.76 0.38 32.20 | 397386.00 342.00 2057.00 26515.17 340.00 28693.95 |
반응형
/*
개발 환경 : SAS University Edition
날짜 : 2017/3/8
*/
SAS 에서 데이터의 산술 평균은 PROC MEANS 를 통해 구할 수 있다. 예제 데이터셋으로는 titanic 데이터셋을 사용하였다.
데이터 읽기
/* 소스 파일: titanic.csv */ /* 소스 경로: /folders/myfolders */ /* 코드 생성일: 17. 3. 7. 오후 3:35 */ FILENAME REFFILE '/folders/myfolders/titanic.csv'; PROC IMPORT DATAFILE=REFFILE DBMS=CSV OUT=WORK.titanic; GETNAMES=YES; RUN;
모든 변수의 평균 구하기
/* 모든 변수의 평균, 합 출력 */ PROC MEANS DATA = WORK.titanic Mean SUM MAXDEC=2; RUN;
위와 같이 하면 모든 변수의 Mean과 Sum을 구한다. MAXDEC는 Max Decimal의 약자로 소숫점 둘째자리까지 출력하라는 의미이다.
MEANS 프로시저
특정 변수의 평균 구하기
특정 변수의 평균만 구하고 싶을 때는 VAR 키워드에 지정해준다.
/* 특정 변수의 평균, 합 출력 */ PROC MEANS DATA = WORK.titanic Mean SUM MAXDEC=2; VAR age; RUN;
MEANS 프로시저
분석 변수 : Age | |
---|---|
평균 | 합계 |
29.76 | 26515.17 |
그룹별로 평균 구하기
그룹별로 평균을 구하고 싶을 때는 CLASS 키워드에 지정해준다.
/* 특정 변수의 평균, 합 출력 */
PROC MEANS DATA = WORK.titanic Mean SUM MAXDEC=2; VAR age; CLASS sex; RUN;
MEANS 프로시저
분석 변수 : Age | |||
---|---|---|---|
Sex | 관측값 수 | 평균 | 합계 |
female | 314 | 28.27 | 8876.00 |
male | 577 | 30.57 | 17639.17 |
참고
반응형
'Tools > SAS' 카테고리의 다른 글
SAS - 연령 변수를 이용해 새로운 범주형 변수 만들기 (0) | 2017.04.01 |
---|---|
SAS - 주민등록번호에서 나이 추출하기 (0) | 2017.04.01 |
SAS - (4) PROC FREQ 빈도 분석 (0) | 2017.03.13 |
SAS - (3) Standard Deviation 구하기 (0) | 2017.03.08 |
SAS - (2) PROC SQL로 새로운 테이블 만들기 (0) | 2017.03.08 |