영희와 현숙의 과목별 점수입니다.
둘의 평균 점수는 같지만
현숙이 영희보다 점수가 더 흩어졌습니다.
이렇게 자료가 흩어진 정도를
산포도Dispersion라 합니다.
대푯값처럼 산포도를 측정하는 수치도 여러 가지 있습니다.
제일 단순한 것은 범위Range입니다.
범위는 최댓값과 최솟값을 뺀 값입니다.
당연히 두 값 사이에 어느 자료가 어떻게 있는지
알 수 없어서 산포도를 충분히 알긴 힘듭니다.
분산Variance과 표준편차Standard deviation는
산포도 수치 중 제일 익숙할 겁니다.
편차제곱합을 자료 크기로 나눈 것이 분산인데
모집단 분산은 N으로, 포본 분산은 n-1로 나눕니다.
분산의 제곱근이 표준편차입니다.
분산은 제곱이라 단위도 제곱이 되는데,
표준편차는 자료와 단위가 같습니다.
그런데 여기가 시끄럽네요.
네, 뭐가 문제죠?
“저기 민호와 제가 자료를 분석했는데요.”
“저긴 10단위고 저는 100단위라서
제 분산, 표준편차가 더 커요.”
“제 자료는 원래 큼직해서
뒤에 0이 하나 더 붙었을 뿐인데
산포도가 다르면 불공평하죠!”
일리가 있습니다.
그래서 변동계수Coefficient of Variation는
표준편차를 평균으로 나눕니다.
무단위라서 단위가 다른 자료와 비교도 가능합니다.
산포도를 나타내는 다른 수치는
사분위범위InterQuartile Range, IQR이 있습니다.
3사분위값에서 1사분위값을 뺀 수치로
중앙 50% 값의 범위입니다.
엑셀에서 산포도 구하기
엑셀에서 분산을 구하는 함수는
VAR.P(모집단)과 VAR.S(표본)입니다.
표준편차를 구하는 함수는
STDEV.P(모집단)과 STDEV.S(표본)입니다.
사분위범위를 구하는 함수는 없지만
사분위수를 구하는 함수를 이용할 수 있습니다.
사분위수를 구하는 함수는
QUARTILE.EXC와 QUARTILE.INC가 있습니다.
'엑셀 > 엑셀로 통계하기' 카테고리의 다른 글
엑셀로 통계하기 6 - 공분산과 상관계수 (0) | 2018.04.30 |
---|---|
엑셀로 통계하기 5 - Z값과 체비셰프 정리 (2) | 2018.04.27 |
엑셀로 통계하기 4 - 왜도와 첨도 (0) | 2018.04.27 |
엑셀로 통계하기 2 - 상자 수염 그림 (2) | 2018.04.23 |
엑셀로 통계하기 1 - 도수분포표, 히스토그램 (0) | 2018.04.22 |