설찬범의 파라다이스
글쓰기와 닥터후, 엑셀, 통계학, 무료프로그램 배우기를 좋아하는 청년백수의 블로그
표준점수 (1)
엑셀로 통계하기 5 - Z값과 체비셰프 정리
반응형





학급 50미터 달리기 기록이

17초로 나왔습니다.

빠른 걸까요?

 



반 전체 평균을 보니 15초입니다.

평균보다 2초 느리군요.

나쁘진 않습니다.

 



그러나 분포도 중요하겠죠.

산포도가 크다면 조금 안심되지만

산포도가 작다면 평균에서 조금만 멀어져도

잘 못 달리게 되니까요.

 



Z(Z-score)

어떤 자료가 평균에서 상대적으로떨어진 거리로

자료에서 평균을 빼고 표준편차로 나눈 값입니다.

(표준점수, 표준값이라고도 합니다)

 

Z값이 2라면 그 자료는 평균보다 2s만큼 크고

-2라면 평균보다 2s만큼 작겠죠.




체비셰프의 정리

 


50미터 달리기로 돌아갑시다.

1학년 1반 평균은 15초였죠.

 

표준편차가 1초라고 하면,

13초와 17초 사이에는 몇 명이 있을까요?

 



러시아 수학자 파프누티 체비셰프는

Z값과 관련한 공식을 발견합니다.

바로 체비셰프의 정리Chebyshev’s Theorem입니다.

(체비셰프의 부등식이라고도 부릅니다)


 


예를 들어 평균과 ±2s 사이에는

최소 (1-1/4)=0.75, 75%의 자료가 존재합니다.

 



1학년 1반을 봅시다.

평균은 15. 표준편차는 1.

13초와 17초 사이는 2s이니까

학급의 최소 75%13초와 17초 사이에 있습니다.

(‘최소 75%’니까 그보다 많을 수도 있음을 명심하세요.)

반응형
  Comments,     Trackbacks