학급 50미터 달리기 기록이
17초로 나왔습니다.
빠른 걸까요?
반 전체 평균을 보니 15초입니다.
평균보다 2초 느리군요.
나쁘진 않습니다.
그러나 분포도 중요하겠죠.
산포도가 크다면 조금 안심되지만
산포도가 작다면 평균에서 조금만 멀어져도
잘 못 달리게 되니까요.
Z값(Z-score)은
어떤 자료가 평균에서 ‘상대적으로’ 떨어진 거리로
자료에서 평균을 빼고 표준편차로 나눈 값입니다.
(표준점수, 표준값이라고도 합니다)
Z값이 2라면 그 자료는 평균보다 2s만큼 크고
-2라면 평균보다 2s만큼 작겠죠.
체비셰프의 정리
50미터 달리기로 돌아갑시다.
1학년 1반 평균은 15초였죠.
표준편차가 1초라고 하면,
13초와 17초 사이에는 몇 명이 있을까요?
러시아 수학자 파프누티 체비셰프는
Z값과 관련한 공식을 발견합니다.
바로 체비셰프의 정리Chebyshev’s Theorem입니다.
(체비셰프의 부등식이라고도 부릅니다)
예를 들어 평균과 ±2s 사이에는
최소 (1-1/4)=0.75, 75%의 자료가 존재합니다.
1학년 1반을 봅시다.
평균은 15초. 표준편차는 1초.
13초와 17초 사이는 2s이니까
학급의 최소 75%가 13초와 17초 사이에 있습니다.
(‘최소 75%’니까 그보다 많을 수도 있음을 명심하세요.)
'엑셀 > 엑셀로 통계하기' 카테고리의 다른 글
엑셀로 통계하기 7 - 조건부 확률과 베이즈 정리 (0) | 2018.04.30 |
---|---|
엑셀로 통계하기 6 - 공분산과 상관계수 (0) | 2018.04.30 |
엑셀로 통계하기 4 - 왜도와 첨도 (0) | 2018.04.27 |
엑셀로 통계하기 3 - 산포도 (0) | 2018.04.27 |
엑셀로 통계하기 2 - 상자 수염 그림 (2) | 2018.04.23 |