설찬범의 파라다이스
글쓰기와 닥터후, 엑셀, 통계학, 무료프로그램 배우기를 좋아하는 청년백수의 블로그
엑셀로 통계하기 3 - 산포도
반응형






영희와 현숙의 과목별 점수입니다.

둘의 평균 점수는 같지만

현숙이 영희보다 점수가 더 흩어졌습니다.



 

이렇게 자료가 흩어진 정도를

산포도Dispersion라 합니다.

 



대푯값처럼 산포도를 측정하는 수치도 여러 가지 있습니다.

 



제일 단순한 것은 범위Range입니다.

범위는 최댓값과 최솟값을 뺀 값입니다.

 


당연히 두 값 사이에 어느 자료가 어떻게 있는지

알 수 없어서 산포도를 충분히 알긴 힘듭니다.

 



분산Variance표준편차Standard deviation

산포도 수치 중 제일 익숙할 겁니다.



 

편차제곱합을 자료 크기로 나눈 것이 분산인데

모집단 분산은 N으로, 포본 분산은 n-1로 나눕니다.



 

분산의 제곱근이 표준편차입니다.

분산은 제곱이라 단위도 제곱이 되는데,

표준편차는 자료와 단위가 같습니다.

 



그런데 여기가 시끄럽네요.

, 뭐가 문제죠?


 

저기 민호와 제가 자료를 분석했는데요.”

 



저긴 10단위고 저는 100단위라서

제 분산, 표준편차가 더 커요.”

 

제 자료는 원래 큼직해서

뒤에 0이 하나 더 붙었을 뿐인데

산포도가 다르면 불공평하죠!”

 


일리가 있습니다.

그래서 변동계수Coefficient of Variation

표준편차를 평균으로 나눕니다.

무단위라서 단위가 다른 자료와 비교도 가능합니다.


 

산포도를 나타내는 다른 수치는

사분위범위InterQuartile Range, IQR이 있습니다.

3사분위값에서 1사분위값을 뺀 수치로

중앙 50% 값의 범위입니다.






엑셀에서 산포도 구하기




엑셀에서 분산을 구하는 함수는

VAR.P(모집단)VAR.S(표본)입니다.


표준편차를 구하는 함수는

STDEV.P(모집단)STDEV.S(표본)입니다.




사분위범위를 구하는 함수는 없지만

사분위수를 구하는 함수를 이용할 수 있습니다.

사분위수를 구하는 함수는

QUARTILE.EXCQUARTILE.INC가 있습니다.



반응형
  Comments,     Trackbacks