이산확률분포와 다르게
연속확률분포는 연속적입니다.
확률변수의 값이 1, 2, 3…처럼 특정하지 않고
‘1~100 사이 어딘가’를 가리키죠.
연속확률분포 중에서 제일 유명한 분포는
정규확률분포 Normal probability distribution입니다.
정규확률분포는 자연과 사회에서
주로 보이는 분포로, 그만큼 중요하고 널리 쓰입니다.
정규확률분포를 정하는 수는 두 가지,
평균과 표준편차(분산)입니다.
표준정규확률분포
정규확률분포 중에서 평균이 0, 표준편차가 1인 분포를
표준정규확률분포 Standard normal probability distribution이라 합니다.
모든 정규확률분포는
확률변수에서 평균을 빼고 표준편차로 나누면(z)
표준정규확률분포가 됩니다.
이를 이용해 쉽게 확률을 구할 수 있습니다.
예를 들어 평균이 10, 표준편차가 5, 정규분포를 따르는 자료가 있습니다.
확률변수가 20 이하일 확률은 얼마일까요?
20에서 평균을 빼고 표준편차로 나누면
표준정규확률분포 위 확률변수가 되는데,
(20-10)/5=2입니다.
그럼 원래 자료가 20 이하일 확률은
표준정규확률분포에서 2 이하일 확률과 같습니다.
그리고 수학자들은 표준정규확률분포 속 확률을
미리 다 계산해 놓았습니다.
찾아보니 표준정규확률분포에서 2 이하일 확률은
0.97725(97.73%)군요.
표준정규확률분포 표와 계산기는 인터넷에 널리고 널렸으니
필요하시면 검색하시기 바랍니다.
엑셀에서 정규확률분포 구하기
사실, 엑셀만 있으면 표준정규확률분포표를 보실 필요가 없습니다.
이미 정규확률분포를 구하는 함수가 있기 때문입니다.
NORM.DIST 함수는 정규확률분포 확률을 구합니다.
=NORM.DIST(x , 평균 , 표준편차 , TRUE/FALSE)
TRUE : x까지 누적확률
FALSE : x의 확률함수 값
NORM.S.DIST 함수는 표준정규확률분포 확률을 구합니다.
=NORM.S.DIST(z, TRUE/FALSE)
z = 확률변수에서 평균을 빼고 표준편차로 나눈 값.
TRUE : z까지 누적확률
FALSE : z의 확률함수 값
표준정규분포 누적확률로 z를 역계산하는 함수도 있습니다.
NORM.S.INV 함수입니다.
=NORM.S.INV( 누적확률 )
'엑셀 > 엑셀로 통계하기' 카테고리의 다른 글
엑셀로 통계하기 12 - 구간추정(1) (0) | 2018.05.08 |
---|---|
엑셀로 통계하기 11 - 로그정규/지수/와이불 (0) | 2018.05.04 |
엑셀로 통계하기 9 - 초기하확률분포 (0) | 2018.05.03 |
엑셀로 통계하기 8 - 이산확률분포 (0) | 2018.05.01 |
엑셀로 통계하기 7 - 조건부 확률과 베이즈 정리 (0) | 2018.04.30 |