설찬범의 파라다이스
글쓰기와 닥터후, 엑셀, 통계학, 무료프로그램 배우기를 좋아하는 청년백수의 블로그
초기하분포 (1)
엑셀로 통계하기 9 - 초기하확률분포
반응형





상자에 검은 공 다섯 개와 흰 공 네 개가 들어 있습니다.

공 세 개를 뽑을 때 모두 검은 공일 확률은 얼마일까요?


 

첫 공이 검은 공일 확률은 5/9

두 번째가 검은 공일 확률은 4/8

세 번째도 검은 공일 확률은 3/7

세 값을 전부 곱하면 약 0.119(11.9%)입니다.


 

수학 시간에 자주 풀어보셨죠?

이때 공을 다시 넣느냐 안 넣느냐를 헷갈리면 문제를 틀렸죠.

 



사실 실생활에서 물건, 사람을 뽑으면

대부분 한 번 뽑은 건 다시 뽑지 않습니다.

 


초기하확률분포 Hypergeometric probability distribution

이처럼 뽑은 걸 돌려놓지 않으면서 뽑을 때 나타나는

확률분포함수입니다.

 



이항분포와 비슷하지만

시행마다 확률이 같은 이항분포와 다르게

초기하확률함수는 시행마다 확률이 바뀝니다.

 



사실 초기하확률함수도 모집단 크기가 아주 크면

이항분포와 매우 비슷해지고, 근사하기도 합니다.

 




초기하확률함수의 확률



 

공이 N개가 있는 상자에

검은 공은 r개 있습니다.



 

여기서 n개를 무작위로 복원 없이 추출할 때

검은 공 x개를 뽑을 확률은 다음과 같습니다.

 

초기하확률함수의 기댓값과 분산도 알아두시면 좋습니다.





 


엑셀에서 초기하확률분포 계산하기.



 

엑셀에는 초기하확률분포를 구하는

HYPGEOM.DIST 함수가 있습니다.



 

=HYPGEOM.DIST( x , n , r , N , TRUE/FALSE)

총 N개 중 원하는 r개가 있을 때,

n번 뽑아(돌려놓지 않음) x번 원하는 것이 나올 확률.

TRUE : x번 이하로 성공할 확률(누적확률)

FALSE : x번 성공할 확률(개별확률)



 

그럼 맨 처음에 나온 문제를 풀어봅시다.

 


상자에 검은 공 다섯 개와 흰 공 네 개가 들어 있었죠.

공 세 개를 뽑을 때 모두 검은 공일 확률은 얼마일까요?


 


N = 9

r = 5

n = 3

x = 3,

개별확률이므로 FALSE로 입력합니다.



 

방금 구한 값과 똑같습니다.

 



그럼 공 세 개를 뽑을 때 검은 공이 두 번 이하일 확률은 얼마일까요?

 



x2로 바꾸고 FALSE 대신 TRUE를 넣으면 되겠죠.

반응형
  Comments,     Trackbacks