설찬범의 파라다이스
글쓰기와 닥터후, 엑셀, 통계학, 무료프로그램 배우기를 좋아하는 청년백수의 블로그
분류 전체보기 (499)
엑셀로 통계하기 17 - 분산분석(1)
반응형




시작하기 전에



  이제 여러분은 표본평균을 바탕으로 두 모집단의 평균을 비교할 수 있습니다. 그런데 모집단이 여럿이면 어떡하죠?

 


시작!

 

  지난 시간엔 평균을 비교했습니다. 두 표본집단 자료로 두 모집단의 평균이 같은지 다른지를 귀무가설과 대립가설을 세워 대조했습니다.

 

  그런데 모집단이 여럿이라면 어떡할까요? 이전에 배운 평균비교는 두 모집단만 비교할 수 있습니다. ‘모집단 1의 평균=모집단 2의 평균, 모집단 2의 평균=모집단 3의 평균.’처럼 귀무가설을 여러 가지 세워서 동시에 만족하나 살피려면 너무 복잡하고 번거롭습니다.

 

  분산분석(ANOVA, ANalysis Of VAriance)은 여러 모집단의 모평균이 같은지를 한 번에 비교할 수 있는 기술입니다. 영국의 학자 로날드 피셔가 개발한 분산분석은 여러 제약조건이 있기는 하지만 여러 모집단 평균을 동시에 비교할 수 있는 강력한 기술입니다.

 


분산분석 조건


  분산분석을 시작하기에 앞서, 분산분석에 필요한 가정 세 가지를 알아봅시다.

 

첫째, 모집단은 전부 정규분포를 따른다.

둘째, 모집단의 분산은 전부 같다.

셋째, 표본은 무작위로 추출하고 모집단마다 표본은 독립적이다.

 

  첫째 조건이야 표본 크기가 크면 어떻게든 무마한다고 칩시다. 셋째 조건도 지키기 쉽습니다. 둘째 조건은 조금 까다로운데, 여러 모집단의 분산이 전부 같아야 하기 때문입니다. 여러분이 공정을 비교해 제일 빠른 공정을 찾고 싶은 공장장이라면, 공정을 제외한 요소들은 전부 같게 맞춰서 모집단마다 분산이 같도록 애써야 할 것입니다.

 


분산분석 용어




  여러분은 제일 빠른 공정을 찾고 싶은 공장장입니다. 여러분은 온도와 첨가제를 달리하면서 제일 빠른 공정을 찾아낼 겁니다. 온도는 100도와 200도로 조절하고 첨가제는 A, B, C 세 종류가 있습니다. 그럼 온도 두 가지와 첨가제 세 가지로 여섯 가지 조합이 나옵니다.

 

  여기서 온도와 첨가제는 인자Factor이며 인자는 분산분석에서 제어 가능한 독립변수입니다. 100, 200도 같은 선택지는 수준Level입니다. ‘100도와 첨가제 A’, ‘200도와 첨가제 B’같은 조합은 처리Treatment라고 부릅니다. 이렇게 여러 처리에 따른 공정 시간은 반응 변수Response Variable이라고 부릅니다.

 

공장장인 여러분에게

  인자는 온도와 첨가제가

  온도엔 두 가지 수준, 첨가제엔 세 가지 수준이

  이번 분산분석에는 여섯 가지 처리가 있으며

  공정에 걸리는 시간이 반응변수입니다.

 

 

분산분석을 시작하자





 

  지금은 첨가제 A, B, C만 생각합시다. 세 첨가제를 넣어 각각 다섯 번 측정했습니다. 15가지 자료가 있겠네요. 세 표본을 보고 세 모집단 평균이 같은지 다른지 알아보고 싶습니다. 먼저 세 모집단 평균이 전부 같다는 귀무가설을 세워 보죠.




 

  아무 값이나 골라 봅시다. 이 값은 모집단 평균과 다를 겁니다. 왜 다를까요? 두 가지 이유를 생각할 수 있습니다.

 

첫째, 이 값이 속한 처리(첨가제 B) 때문에.

둘째, 같은 처리 속에서도 값이 조금씩 다르므로.

 

  즉 이 값과 모집단 평균의 차는 첨가제가 달라서 오는 차이와 그냥 이 값 자체가 달라서 오는 차이로 나눌 수 있습니다. 첨가제가 달라서 오는 차이는 첨가제마다 있는 표본평균과 총평균의 차이로 표현합시다. 이 값 자체가 달라서 오는 차이는 자료값과 표본평균의 차이로 표현합시다. 모집단 평균은 일단 15가지 자료의 총평균으로 추측하고요. 이 내용을 수학적으로 근사하게 쓰면 다음과 같을 겁니다.



 

이제 이걸 제곱해서 모든 값에 합합니다.



 

(자료와 평균의 차이는 합하면 0이라서 마지막 항은 사라집니다.)

 




  자료와 총평균 차이의 제곱합은 총제곱합(Total Sum of Squares, TTS/SST), 표본평균과 총평균 차이의 제곱합은 처리제곱합(Sum of Squares for TReatments, SSTR), 자료값과 표본평균 차이의 제곱합은 오차제곱합(Error Sum of Squares, ESS/SSE)이라고 부릅니다.






  처리제곱합의 자유도는 표본집단 수 1, 오차제곱합의 자유도는 총 자료 수 –표본집단 수입니다. 갑자기 웬 자유도냐 싶겠지만 분산분석을 하려면 필요합니다. 이번 경우에는 처리제곱합의 자유도는 3(첨가제 가짓수)-1=2, 오차제곱합의 자유도는 15(총 자료 수)-3=12입니다.


 


  처리제곱합을 자유도로 나누고 오차제곱합도 자유도로 나눕니다. 이 값은 각각 처리제곱평균(TReatment Mean Square, MSTR), 오차제곱평균(Error Mean Square, MSE)라고 합니다. 자유도는 좀 있다 또 필요합니다.

 




 

거의 다 왔다. 힘내자!

 

  분산분석을 끝마치려면 F분포가 필요합니다. 그냥 그런 분포가 있다고 알면 됩니다. F분포는 자유도에 따라 모양이 다릅니다. 스튜던트 t 분포랑 비슷하죠. F분포는 그런데 자유도가 둘 필요합니다. 맞습니다. 아까 구한 두 자유도를 F분포에 넣어야 합니다.




  그리고 처리제곱평균을 오차제곱평균으로 나눕니다. 이 값은 귀무가설이 틀릴수록 커집니다. 슬슬 감이 오지 않습니까? F분포에서 이 나눈 값보다 큰 영역이 바로 분산분석의 p값입니다. 귀무가설이 틀릴수록 처리제곱평균/오차제곱평균은 커지고, F분포에서 이 값보다 큰 영역은 줄어듭니다. p값이 작아집니다. p값이 유의수준보다 작으면 귀무가설을 기각하는 건 상식이겠죠?

 


엑셀에서 분산분석 하기



 

  엑셀 데이터 분석 메뉴에는 분산분석: 일원 배치법이 있습니다.




  입력 범위, 데이터 방향, 유의수준을 입력하고 확인을 누릅니다.



 

 

그럼 인자가 둘일 땐?


  이번 시간에는 인자가 하나일 때를 놓고 분산분석을 했습니다. 첨가제 하나만 보았죠. 그런데 첨가제뿐 아니라 온도에 따라서도 모집단 평균이 같은지 알고 싶으면 어떻게 할까요? 지금까지는 인자가 하나인 일원 배치법 One way factorial design’을 배웠다면, 다음 시간에는 인자가 둘인 이원 배치법 Two way factorial design’ 분산분석을 알아봅시다.

반응형
  Comments,     Trackbacks
5월 다섯째 주 닥터후 소식
반응형

  날씨가 더워집니다. 5월부터 이러면 8월은 어떻게 버틸지 걱정됩니다. 더운 날씨처럼 닥터후 소식도 조금씩 주는 듯합니다.

 


닥터후가 트위치에 착륙하다



 

  몇 년 전만 해도 국내 개인방송은 아프리카TV가 꽉 잡고 있었습니다. 경쟁 없는 독점은 화를 부른다고 했나요. 아프리카TV는 여러 방송인의 부도덕한 행위, 게으른 운영 등으로 불만을 쌓아갔습니다. 그러던 와중 몇 방송인이 아프리카TV를 탈출하면서 일명 아프리가 엑소더스가 발생했습니다. 많은 방송인이 아프리카TV를 나와 찾은 곳은 외국 플랫폼 트위치였습니다.

 

  트위치는 우리나라 아프리카TV처럼 개인이 방송하는 플랫폼입니다. 작년부터 국내 이용자가 급증해 요즘은 아프리카TV와 국내 1위 개인방송 플랫폼을 두고 다투고 있습니다. 저도 개인적으로 트위치 방송을 즐겨 봅니다. 트위치는 가끔 밥 로스의 그림 그리기(참 쉽죠?)나 칼 세이건의 코스모스를 방송하기도 했습니다. 그런데 이번에 트위치에서 닥터후 클래식 에피소드를 방송한다고 합니다.

 

  1963년 닥터후의 시작을 알린 <An Unearthly Child>에서 시작해 19897대 닥터 마지막 에피소드인 <Survival>까지 방송하게 되는데요. 사실 전편 방송은 아닙니다. 사라진 에피소드가 있는 시리얼은 통째로 빠지고 많은 달렉 에피소드가 방영 목록에 없습니다. 팬들은 달렉 에피소드는 판권 문제 때문에 방송하지 않는다고 추측합니다. 에피소드가 사라진 시리얼은 그냥 방송하면 이상하니까 그렇다고 쳐도 달렉 에피소드가 빠진 것은 아쉽습니다.

 

  외국에서 진행하는 방송이니 당연히 한글자막은 없습니다. 그래도 혹시 무료로 닥터후를 시청하고 싶은 분에게는 큰 선물이겠죠. 이번 방송은 현지시각 529일부터 시작해 주중에만 방송하며, 거의 세 시리얼을 연속으로 방송합니다. 하루에 무려 세 번이나 반복해서 틀어주고 한국 시각으로 새벽 3시에 시작합니다.

 


방송하는 곳


방송 시간표 링크



빅 피니시를 듣다.

 

  이번 주에도 돌아왔습니다. 빅 피니시 닥터후 오디오 드라마를 듣는 시간. 이번 시간에는 50주년 기념 오디오 <The Light at the End>입니다.



 

  1대부터 8대까지, 닥터에게 큰 위협이 닥칩니다. 타디스 조종간에는 본 적 없던 빨간 불이 들어오고, 닥터들은 조금씩 음모에 휘말립니다. 이 음모 한가운데에는 마스터가 있는데. 과연 닥터들과 컴패니언들은 마스터의 계략을 무찌르고 탈출할 수 있을까요?

 

  <The Light at the End>는 빅 피니시가 닥터후 50주년을 기념해 제작한 오디오 드라마입니다. 4대 닥터 톰 베이커부터 8대 닥터 폴 맥간까지 드라마에 출연했고, 배우가 죽은 1대부터 3대까지는 다른 배우가 맡았습니다. 컴패니언으로는 4대 닥터와 여행하던 여전사 릴라, 5대 닥터와 여행하던 금수저 아가씨 니사, 6대 닥터와 여행하던 불쌍왕(?) 페리, 7대 닥터와 여행하던 사춘기 소녀 에이스가 나옵니다.

 

  제가 알기로 이 당시 빅 피니시는 2005년 이후 닥터후, 속칭 뉴닥판권이 없었습니다. 설령 있었다고 해도 크리스토퍼 에클스턴과 데이비드 테넌트를 캐스팅할 수는 없었겠죠. 50주년 에피소드 <The Day of the Doctor>와 별개로, 클래식 닥터후가 그리운 사람을 위한 또 하나의 선물이라고 생각하면 좋을 것 같습니다.(데이비트 테넌트는 빅 피니시가 판권을 얻은 이후 닥터후 드라마를 녹음합니다.)

 

  닥터들이 만나는 드라마인 만큼 클래식 닥터들의 케미와 만담이 재미있는 드라마 <The Light at the End>. 영어도 쉬운 편이고, 영어를 몰라도 목소리만 들어도 닥터후 팬은 즐겁습니다. 위에 설명한 컴패니언뿐 아니라 다른 컴패니언도 짧게 출연하니 관심 있는 분은 한 번 사서 들어보시기 바랍니다. 실제 여러 팬이 빅 피니시 입문작으로 추천하는 드라마입니다.

반응형

'닥터후' 카테고리의 다른 글

6월 마지막 주 닥터후 소식  (0) 2018.06.25
6월 첫째 주 닥터후 소식  (0) 2018.06.04
5월 넷째 주 닥터후 소식  (0) 2018.05.21
5월 셋째 주 닥터후 소식  (0) 2018.05.14
5월 둘째 주 닥터후 소식  (0) 2018.05.08
  Comments,     Trackbacks
엑셀로 통계하기 16 - 평균비교
반응형




시작하기 전에...




  두 공장이 있습니다. 공장 A와 공장 B는 같은 제품을 생산하지만 공정은 다릅니다. 두 공장 중 어느 공장이 더 빨리 생산하는지 알고 싶습니다. 어떻게 해야 할까요?



시작!

 

  지난 시간에는 귀무가설과 대립가설을 세운 뒤, 그 귀무가설을 기각할 수 있는지 알아냈습니다. 표본평균이 어느 값 이상인지/이하인지/같은지 가설을 세운 다음, 모집단 표준편차를 알 때와 모를 때로 나누고, 귀무가설에 맞는 p을 구해 유의수준과 비교해서, p값이 유의수준보다 작으면 귀무가설을 기각했습니다.

 

  이번 평균비교는 방법 자체는 p값 방법과 거의 같습니다. 모집단 표준편차를 알 때 모를 때를 나눈다거나, p값을 구한다거나 하는 과정은 같습니다. 다만 두 모집단의 평균이 같은지 다른지 알아내는 과정인 만큼 모집단의 표준편차가 둘인 점 등이 다릅니다.

 


평균 비교하기


  우리는 두 모집단의 평균이 같은지 알고 싶습니다. 각 모집단에서 표본을 추출해서 자료를 조사했습니다. 모집단 1의 표본평균, 모집단 2의 표본평균을 구합니다.




 

  지난 시간 귀무가설은 모집단 평균이 ~ 이하다/이상이다/~였습니다. 이번에도 이런 방식을 사용합시다. 두 모집단 평균이 같다면, 두 모집단 평균을 뺀 값은 0입니다. 따라서 귀무가설은 두 모집단 평균의 차이는 0이다이고 대립가설은 두 모집단 평균의 차이는 0이 아니다 입니다.

 

  지난 시간에는 표본평균의 표본분포를 만들었습니다. 표본분포는 기댓값이 귀무가설에 나온 그 값이고 표본분포의 분산은 모집단 분산에서 표본 크기를 나눈 값인 정규분포였습니다. 이번엔 두 표본평균 차이의 표본분포를 만듭니다. 역시 정규분포입니다. 기댓값은 0입니다. 그런데 분산(표준편차)는 어떻게 구할까요? 두 모집단의 분산이 다르고, 심지어 두 표본의 크기도 다를 텐데요.




 

  표본평균 차이의 표본분포 표준편차 공식은 이렇습니다. 이제 표본평균 차이의 표본분포를 알 수 있습니다.



 

  그럼 나머지는 귀무가설 검정과 같습니다. 표본평균 대신에 표본평균 차이로 z값을 구할 뿐이죠. z값이 3이라면, p값은 표본평균 차이 표본분포에서 3이하/3이상인 영역 넓이입니다. 이 넓이가 유의수준보다 작다면 귀무가설을 기각할 수 있고 따라서 두 모집단의 평균이 다르다는 결론을 내릴 수 있습니다.

 

요약) 두 모집단 평균비교(모집단 표준편차를 알 때)

1) 표본평균 차이로 귀무가설/대립가설을 세운다

2) 표본평균 차이의 분포(정규분포)를 만든다

3) 표본평균 차이에서 z값과 p값을 구한다.

4) p값과 유의수준을 비교한다.

 


모집단 표준편차를 모를 때

 

  그럼 두 모집단의 표준편차를 모를 때는 어떻게 할까요? 가설 검정에서는 표본의 표준편차를 모집단 표준편차로 추정하고, 정규분포 대신 스튜던트 t분포를 사용했습니다. t분포의 자유도는 표본 크기-1이었죠.

 

  평균비교도 두 모집단 표준편차 대신 표본 표준편차를 사용합니다. 자유도는 어떡하냐고요? 자유도 공식은 다음과 같습니다.




 

나머지 방법은 같습니다.

 

요약) 두 모집단 평균비교(모집단 표준편차를 모를 때)

1) 표본평균 차이로 귀무가설/대립가설을 세운다

2) 표본평균 차이와 표준편차로 분포(정규분포)를 만든다

3) z값을 구하고 스튜던트 t분포에 맞는 p값을 구한다

4) p값과 유의수준을 비교한다

 





엑셀에서 평균 비교하기(모집단 표준편차를 알 때)



1) 엑셀 [데이터] - [데이터 분석]에 들어갑니다.

(없다면 [파일] - [옵션] - [추가 기능]에서 추가합니다)




2) 'z-검정 : 평균에 대한 두집단'을 선택합니다.





3) 변수 범위, 가설 평균차(여기서는 0), 두 모집단의 분산('분산-기지값', 기지旣知는 이미 안다는 뜻), 유의수준을 입력하고 '확인'을 누릅니다.



엑셀에서 평균 비교하기(모집단 표준편차를 모를 때)

 


1) 엑셀 [데이터] - [데이터 분석]에 들어갑니다.

(없다면 [파일] - [옵션] - [추가 기능]에서 추가합니다)


 


2) ‘t-검정: 이분산 가정 두집단을 선택합니다.




3) 변수 범위, 가설 평균치(0), 유의수준을 선택하고 확인을 누릅니다.

 

반응형
  Comments,     Trackbacks
5월 넷째 주 닥터후 소식
반응형

  벌써 날씨가 덥습니다. 5월도 이 정도인데, 8월은 상상도 하기 싫네요. 그러나 빨리 여름이 지나가고 닥터후가 찾아왔으면 합니다.



휴 그랜트, 닥터가 되지 못한 속사정


사진출처:Julien Rath (https://www.flickr.com/photos/julienrath)



  러셀 T 데이비스는 닥터후를 부활시키며 휴 그랜트에게 닥터 역을 제시했습니다. 결국 크리스토퍼 에클스턴이 9대 닥터 배역을 차지했죠. 휴 그랜트가 될 뻔했다는 이야기는 팬들 사이에 알음알음 알려졌는데, 이번에 자세한 사정이 드러났습니다.


  러셀 T 데이비스는 최근 <A Very English Scandal>이라는 드라마에 참여했습니다. 그 기회에 주연을 맡은 휴 그랜트에게 이 사실을 물어봤더니, 전혀 모른다고 답했다는군요. 알고 보니 에이전트 레벨에서 거절당한 모양입니다. 휴 그랜트 본인도 '나한테 제안이 왔다는 소문을 들었지만, 나는 전혀 아는 바가 없었다.'고 답했다 합니다.


  크리스토퍼 에클스턴도 훌륭한 배우지만, 휴 그랜트가 9대 닥터를 맡았으면 어땠을지 궁금합니다.




닥터후를 녹음한 주역이 세상을 떠나다



  옛날 닥터후 에피소드 중엔 녹화본을 잃어버린 에피소드가 한둘이 아닙니다. 이들을 사라진 에피소드(Missing episodes)라고 합니다. 옛날 닥터 후는 여러 에피소드가 한 스토리, 즉 시리얼Serial을 구성했습니다. 이중 사라진 에피소드는 97편, 에피소드 전편이 사라진 시리얼은 10편에 달합니다.


  지금이야 손바닥만 한 드라이브에 저장하지만, 옛날에는 큼지막하고 비싼 녹화 장치에 에피소드를 저장했습니다. 그 당시엔 재방송이라는 개념이 희귀했고, 비디오도 없으니 드라마 판매라는 것도 상상하기 어려웠죠. 결국 BBC는 공간을 차지한다는 이유로 에피소드들을 버리거나, 다른 녹화본을 덧씌웠습니다.


  지금도 BBC와 팬덤은 잃어버린 닥터후 에피소드를 찾고 있고, 일부는 찾아냈습니다. 수집가한테 문의하고 전세계를 뒤졌죠. 실제 <The Tomb of the Cyberman>은 홍콩에서 찾아냈습니다. 일부 장면을 발췌한 다른 프로그램에서 다시 역수입하거나, 외국 방송국에서 검열하면서 잘라낸 필름을 얻어내거나 심지어 회상 장면에서 재등장하는 장면이라도 긁어 모았습니다.


  일부 에피소드는 BBC가 애니메이션으로 재구성했습니다. 이때 녹음본이 큰 역할을 했죠. 당시 일부 팬들이 텔레비전 소리를 녹음했는데, 이마저도 없었으면 지금 우리는 그 에피소드를 아무 것도 모를 뻔했습니다.


  에피소드를 녹음한 사람 중 하나가 바로 그레이엄 스트롱입니다. 당시 전자기기에 관심이 많던 그레이엄 스트롱은 닥터후를 시청하면서 텔레비전 사운드를 녹음했습니다. 나중에는 지식을 활용해 텔레비전 음성 신호를 곧장 녹음기에 연결해 녹음했고, 그 덕분에 아주 깔끔한 소리를 얻었습니다. 심지어 BBC가 보관하던 에피소드보다 더 깔끔한 녹음도 있었습니다.


  그레이엄 스트롱이 만든 녹음본은 BBC가 사라진 에피소드를 애니메이션으로 만들 때 쓰기도 했고, 옛날 에피소드에서 소리만 스트롱의 녹음본으로 바꾸어 DVD를 출시하기도 했습니다. 가히 닥터후 팬의 구세주라고 할 수 있는 그레이엄 스트롱은 최근 69세로 세상을 떠났다고 합니다. 명복을 빕니다.






* 빅 피니시 오디오를 듣다.




  이번 주부터 생긴 코너입니다. 최근 꽁돈이 생겨 빅 피니시에 들어가 닥터후 오디오 드라마를 샀습니다. 한 주에 한 편씩 감상문을 작성해보겠습니다. 물론 돈이 부족하면 못 살 수도 있고요.




  오늘 얘기할 작품은 2001년 나온 <Colditz>입니다. 7대 닥터와 컴패니언 에이스가 주인공이고 캐릭터를 TV 연기한 실베스터 맥코이와 소피 알드레드가 녹음했습니다. 나치 패망 직전이던 1944년, 닥터와 에이스는 나치군이 주둔한 콜디츠 성에 도착해 붙잡힙니다. 그 와중에 미스터리한 여성 '클라인'은 마치 닥터와 타디스의 존재를 아는 듯 하는데, 과연 닥터와 에이스는 성을 탈출하고 클라인의 음모도 물리칠 수 있을까요?


  많고 많은 빅 피니시 작품 중 이걸 구매한 이유는 두 가지입니다. 첫째는 7대 닥터 작품을 한 번 들어보고 싶은 마음입니다. 둘째는 다름이 아니라 데이비드 테넌트입니다. 10대 닥터를 연기한 데이비드 테넌트가 이 오디오 드라마에 등장합니다. 닥터를 맡기 전 테넌트가 풋풋한(?) 목소리와 어색한(?) 독일 억양으로 연기하는 나치 장교를 들으면 손발이 오그라듭니다.


  부족한 영어로 들어본 결과, 스토리는 나쁘지 않습니다. 다만 2001년에 나와서 그런지 음질이 조오금 부족합니다. 특히 좁은 공간에서 두 사람이 대화하는 장면은 목소리가 울려서 듣기가 힘듭니다. 이런 것까지 구현할 필요는 전혀 없는데 말이죠.


  <Colditz>는 빅 피니시에서 2.99달러에 구매 가능합니다.(이러니까 무슨 판매원 같기도 하고...)



반응형

'닥터후' 카테고리의 다른 글

6월 첫째 주 닥터후 소식  (0) 2018.06.04
5월 다섯째 주 닥터후 소식  (0) 2018.05.28
5월 셋째 주 닥터후 소식  (0) 2018.05.14
5월 둘째 주 닥터후 소식  (0) 2018.05.08
오랜만에 돌아온 닥터후 소식  (0) 2018.02.08
  Comments,     Trackbacks
외로운 중간, 고독한 중간
반응형



TV를 보다 보면, 특히 케이블 방송이나 뉴스 채널을 보면 프로그램 사이마다 기부 광고를 볼 수 있습니다. 주로 유니세프나 난민기구에서 만든 것인데요. 전쟁과 기아로 죽어가는 아이와 여성들을 보여줘서 여러분의 죄책감을 유도합니다. 아이들 눈에서 눈물이 흐르고, 애잔한 바이올린 선율이 슬픔을 더합니다. 해설 목소리는 화룡점정으로 기부 전화번호를 불러주죠.

 

물론 그 사람들은 도움을 받아야 합니다. 저도 기아와 전쟁, 난민이 없는 세상을 원하죠. 이런 일들은 세상에 다시 없을 비극입니다. 그러나 오늘은 굶지도 죽어가지도 않는 사람을 이야기하고 싶습니다.

 

아시다시피, 학교는 줄을 잘 세웁니다. 시험을 보고 성적이 나오면 점수를 바탕으로 등수를 매깁니다. 등수가 높을수록 좋은 대학교에 가고, 좋은 대학교에 가면 좋은 회사에 취직하고, 회사에서 높은 점수를 기록하면이런 식으로 계속되죠. 많은 책과 강의와 사상가들은 이런 등수 매기기를 비판해 왔습니다. ‘사람은 다원적이다.’, ‘다양성을 생각해야 한다.’든가. 많이 들어보셨을 테죠.

 

저도 등수 매기기의 단점을 하나 알고 있습니다. 바로, ‘중간 놓치기입니다. 말 그대로 등수 시스템에서는 중간이 행복할 수 없다는 의미죠. 꼴등도 불행한 것은 마찬가지입니다. 꼴등은 늘 멸시받고, 무시당하고 차별당합니다. 그러나 중간 등수도 다른 방법으로 불행해집니다. 동정도 못 받고, 그렇다고 뻐길 만큼 등수도 높지 않습니다. 근처 사람에게 불평해 봤자 배부른 소리라며 무시당하죠. ‘넌 그래도 하위권은 아니잖아.’

 

전 이런 무시당하는 중위권도 보살펴야 한다고 생각합니다. 특히 경제성장을 이뤄냈다가 하락하는 한국 같은 나라는 더욱이요. 지금 젊은 세대는 경제 내림세로 고통받습니다. 그러나 이들이 신세를 한탄하면 돌아오는 소리는 비슷하죠. ‘옛날에는 이것보다 더 심했어.’, ‘옛날에는 다 굶고 살았어. 지금은 굶지는 않잖아.’ 그렇습니다. 지금 우리나라는 나무 껍데기를 벗겨 먹거나 언제 떨어질지 모르는 포탄에 벌벌 떨 필요는 없습니다. 그렇다고 사람이 위로받을 필요가 없을까요? 옛날보다 잘살게 되면 불평불만을 하나도 이야기하면 안 되는 걸까요? 제가 부모님, 조부모님보다 건강하면 병원에 가지도 못 하나요?

 

사람은 태어나서 누구나 아픈 일이 있습니다. 길을 가다 넘어지는 것에서부터 상사에게 잔소리 듣기, 재산과 가족을 잃는 것까지 크기와 종류는 다양합니다. 인류는 그런 고통을 없애려 했고, 그 결과 지금의 문명을 이뤘습니다. 농사법을 발전시키고 전기를 발명하고 민주주의와 기타 정치제도를 만들었습니다. 모든 이의 목적이 일치하지는 않았고 우여곡절도 많았지만, 인류 문명 역사는 아마 덜 아픈 세상을 만드는 역사라 불러도 좋을 겁니다.

 

그래도 인간은 아픕니다. 아프면 치료해야 합니다. 아프지 말아야 할 의무 같은 건 없습니다. 그런 의미에서 중위권은 늘 고독합니다. 하위권은 동정을 받습니다. 상위권은 권위를 누립니다. 그러나 권위를 누리기엔 낮고, 동정을 받기엔 높은 중위권은 불만을 말할 곳도 없습니다. 입을 열었다가는 양쪽에서 비난을 받습니다. ‘너는 그 정도면 다행인 줄 알아라.’, ‘좀 더 노력해서 올라오면 되잖아.’

 

다시 말합니다. 아픔을 말할 자격 따위는 없습니다. 자원이 한정적일 때 그 자원으로 급한 사람부터 처리해야 할 수야 있겠습니다만, 그렇다고 입까지 막을 수는 없습니다. 사람이 아픔을 말하지 못하면 비뚤어집니다. 누군가를 혐오하고 비아냥댑니다. 말해도 듣지를 않는데, 왜 말을 하겠습니까. 주먹을 휘두르지. 저는 지금 만연한 혐오 정서 일부는 등수 매기기 문화에 차별적 동정이 결합해 태어났다고 생각합니다.

 

  그렇다고 힘들게 사는 사람을 무시하자는 이야기는 아닙니다. 솔직히 말해, 저도 답을 모르겠습니다. 문제를 던져놓고 답을 하지 말자니, 참 이기적으로 보이겠지만 정말 그렇습니다. 어쩌면 고통과 설움에 등급을 매기지 않는 것이 시작점일지도 모르겠습니다. 누군가 투덜댈 때, 그 투덜거림이 들어줄 가치가 있는지 따지기보다 그냥 인정하고 위로하는 것이 고독한 중간을 없애는 시작점인지도 모르겠습니다.

반응형

'잡문' 카테고리의 다른 글

나는 벌써 꼰대가 되었는가?  (0) 2018.06.28
우리는 이상한 것을 믿는다  (0) 2018.06.24
끌어당김의 법칙? - 18/04/18  (0) 2018.04.18
<블랙 팬서>와 평론 - 개인적인 생각  (0) 2018.02.12
솦웅님, 솦웅님!  (0) 2017.12.29
  Comments,     Trackbacks
편의점탐험대 - 메로나보틀
반응형

(사피)

얘들아! 너희 메로나 알아?


(이이티)

메로나는 1992년 처음 등장한,

지구의 유명한 아이스크림 아닌가요?

특유의 메론향이 유명하죠.

맛도 좋고 인기도 좋습니다.


(윌비백)

삐빅. 직사각형 모양 안정적임.

메론이 아니라 참외맛이라는 소문 있음.


근데 있지.

그 메로나가 음료수로 탄생한 거 알아?


삐빅. 빙그레는 이미

메로나 제주 스파클링으로

메로나 탄산음료를 만든 적 있음.


아니 아니.

이번엔 메로나를 그대로 음료로 만들었어.

메로나와 맛이 똑같다다던대!

이름은 메로나 보틀이래.




메로나 보틀(빙그레)

230mL(209kCal)

정가 1800원



메로나를 만든 빙그레에서 만들었으니

최소한 짝퉁은 아니겠네요.

제품명부터 대놓고 '메로나'가 들어가고

옆면에는 메로나 사진을 올렸군요.

'이건 메로나야!'라고 대놓고 말하고 있어요.


삐빅. 제품 포장이 메로나와 비슷함.

직사각형. 연두색.

그러나 겉모습만으로 판단은 금물임.


나도 알아.

그러니까 일단 한번 먹어보자니까?

뚜껑을 열고.. 포장을 뜯고..

벌써 메론향이 짙게 나는데?





음. 색도 메로나처럼 연두색일 줄 알았는데.

더 흰색에 가깝네.


삐빅. 어차피 색깔까지 확인하면서

유제품을 마시는 사람은 거의 없음.


알아, 안다고.

그렇지만... 그렇지만...

색도 메로나였으면 더 완벽할 텐데.


사피는 인공색소를 그렇게 드시고 싶습니까?

양은 나쁘진 않은 것 같네요.





좋아. 먹는다?

음....



맛있어!

메로나와 정말 똑같아.

녹인 메로나라고 해도 믿겠는걸.

끝맛이 조금 우유지만 전체적으로 달아.


원래 차가울수록 단맛이 적다고 하죠.

아이스크림이 단맛을 내려면 설탕을 엄청 넣는데,

그걸 녹이면 엄청 달고 맛있는 건 당연지사죠.


삐빅. 실제 더위사냥을 녹이고

냉커피로 대접했다는 인터넷 일화가 있음.




내가 봤을때 메로나 보틀은 잘 팔릴 거야.

메로나도 독보적이잖아?

그러니까 판매량 말고, 맛 말이야.

메론맛 우유라니. 군계일학일 거야.



이미 인터넷에서는 후기가 쏟아지고 있죠.



삐빅. 디자인부터 맛까지.

팔리려고 작정한 제품임.

그러나 차가울 때 먹어야 함.


맞아. 확실히 시원하게 먹어야겠어.

미지근할 때 먹으면 끈적거리겠는걸.

냉동고에 넣어서 살얼음이 낄 때쯤 꺼내

식빵이랑 먹으면 환상적일 거야.


그러고 보니 메로나보틀과 어울리는 음식은

많지 않겠어요.

메로나보틀 자체로 향이 세고 독특해서

맛이 튀는 음식과 먹으면

안 어울리거나 너무 달 거예요.


삐빅. 어느 쪽으로든 독보적임.



총평


좋았어. 점수를 매겨보자.

난 5점 만점에 5점.

메로나를 좋아하는 사람한테 이보다 좋은 유제품은 없을 거야.

특히 아이들이 미쳐버릴 거라고.

호기심으로라도 마셔보길 추천해.


저는 5점 만점에 3점을 주겠습니다.

식사 후 입가심으로 아주 훌륭하고

우유 대용으로는 그럭저럭이죠.

건강음식은 확실히 아니고요.


삐빅. 5점 만점에 4점.

대체제가 없는 희소 음료.

나무막대를 꽂고 얼리고 싶은 충동이 생김.


 




반응형
  Comments,     Trackbacks
이진아기념도서관에 다녀왔습니다
반응형

어제는 이진아기념도서관에 다녀왔습니다.

이진아기념도서관은 서대문 구립 도서관 중 하나로, 독립문역 근처에 있습니다.

 



독립문역 버스정류장에 내렸습니다.

전날 비가 와서 하늘은 잿빛.

습하지만 시원한 바람이 불었습니다.


 


독립문역에는 사람이 많았습니다.

출구 바로 옆에 서대문형무소가 있어서

특히 견학하러 온 아이들이 많았습니다.


 



산책로에 떨어지는 꽃잎들.

바람이 안 부는데도 살살 떨어지는 모습이

너무 예뻐서 찍었습니다.


 



서대문형무소는 학창시절에 한 번 가봤습니다.

오늘 갈 곳은 여기가 아닙니다.


 



서대문형무소 옆 높은 계단을 오르면

이진아기념도서관이 나타납니다.

역시 아이와 나온 부모들이 많았습니다.

공원 가운데에 두꺼운 나무처럼 솟아오른 건물이 인상적입니다.


 


이진아기념도서관은 2003년 미국에서 사고로 사망한

이진아 양의 유가족이 기증한 기금으로 만든 도서관입니다.

처음 도서관 이름을 들었을 때는 지역 예술가나 사업가로 예상했는데

알고 보니 숙연해지는 사연입니다.




 


도서관 1, 2층은 각종 사무실과 유아/청소년 열람실입니다.

책을 읽으려면 3, 4층으로 갑시다.


 


자료실은 가방을 메고 갈 수 없습니다.

3층에 있는 사물함에 100원 동전을 넣고 가방을 보관하고 나서 들어갑니다.

 

일요일은 오후 5시까지.

오후 3시라서 급하게 아무 책이나 집었습니다.

 




제가 읽은 책은 손지상의

<스토리 트레이닝>(온우주, 2015)입니다.

 

책날개에서 화승총을 조종하는 카리스마(?)를 자랑하는

손지상 작가는 스토리를 전이로 해석합니다.

 

추상은 정보가 흡수하면서 구체화합니다.

구체화하면 모순이 생깁니다.

동물에 정보를 추가해 고양이로 만들면 이제 는 불가능해집니다.

독자 머릿속 마땅한 상황이 배신당하는 예기 실패가 벌어집니다.

그리고 이 모순을 다시 해결해 새로운 추상, 질서를 구축합니다.

 

질서 혼돈 새로운 질서.

손지상 작가는 이를 뇌과학과 심리학, 여러 작법서를 기반으로 설명합니다.

 

책은 총 두 권. 이론편과 실전편이지만,

시간 관계로 이론편밖에 읽지 못했습니다.




이진아기념도서관 기본정보


휴관일 : 매주 월요일, 일요일을 제외한 공휴일

종합자료실 운영시간

평일 : 09~22

주말 : 09~17




링크


서대문구립도서관

이진아기념도서관 소개




반응형
  Comments,     Trackbacks
5월 셋째 주 닥터후 소식
반응형

  시즌 11을 기다리다 보니 궁금해집니다. 한국 방송국이(99.9%KBS겠지만) 시즌 11을 방송하면, 누가 13대 닥터를 더빙하게 될까요? KBS가 가끔 삐끗해도, 닥터후는 꽤 준수하게 더빙했으니 새로운 성우진도 기대됩니다.

 


첫째, 4대 닥터 에피소드가 미국 영화관에 걸리다.

 


  닥터후에서 제일 유명한 닥터는 톰 베이커의 4대 닥터가 아닐까 싶습니다. 4대 닥터는 능글맞은 캐릭터와 기발한 줄거리로 닥터후의 전성기를 불러왔습니다. 4대 닥터가 하차한 1981년부터 37년이 지났고 10대 닥터, 12대 닥터 등 굵직한 닥터들이 좋은 연기를 보여줬음에도 4대 닥터는 아직도 닥터후의 스타 비스무리한 존재가 되었습니다.

 

  6월에는 4대 닥터 첫 시즌이 블루레이로 출시됩니다. 이에 따라 미국에선 4대 닥터 에피소드인 <Genesis of the Daleks>(달렉 창세기)가 극장에서 상영됩니다. 611일 단 하루, 750채 극장에서 상영되며 톰 베이커 인터뷰까지 첨부한다고 합니다.

 

  <Genesis of the Daleks>4대 닥터가 처음 등장한 시즌 12의 에피소드로, 1975년에 방송했습니다. 닥터와 사라 제인과 해리 설리반은 스카로 행성에 도착합니다. 타임로드는 닥터에게 달렉의 탄생을 조사하라는 명령을 내립니다. 스카로 행성은 탈과 칼레드, 두 종족이 끝없는 전쟁을 벌이는 중입니다. 칼레드 종족 과학자 다브로스는 전쟁을 끝낼 무기, 달렉을 개발합니다. 과연 닥터 일행은 달렉 탄생을 막을 수 있을까요?

 

 

둘째, 13대 닥터가 소설에도 등장



 

  13대 닥터에 쏟아지는 관심은 다른 닥터를 무색하게 할 정도입니다. 아직 시즌 11이 방송하지도 않았는데, 팬들은 팬 오프닝을 만들고 그림을 그립니다. 관심을 끈다는 목적만 보면 13대 닥터는 지금 성공 가도를 달리는 중입니다.

 

  13대 닥터는 이미 코믹스 등장을 예고했는데, 이번에는 소설입니다. 첫째는 단편집 <Doctor Who: Thirteen Doctors 13 Stories>입니다. 제목처럼 닥터 13명과 각각 열셋 단편을 모은 단편집입니다. 물론 13대 닥터도 이 13 닥터에 들어갑니다. 둘째는 소설 <The Good Doctor>입니다.

 

  두 소설은 각각 10, 11월에 출간됩니다. 시즌 1110월쯤에 방송된다고 하니, 최소한 닥터후 에피소드를 앞지르지는 않겠네요. 하지만 이 소설을 쓰는 작가들은 이미 13대 닥터의 성격, 타디스 내부 디자인, 컴패니언들 정보를 다 전달받았겠죠? 부럽군요.

 





셋째, 시즌11 감독 공개. 2부작 에피소드는?

 

  닥터후는 시즌마다 2부작 에피소드가 있었습니다. 마지막 에피소드 둘은 규모가 규모니만큼 대부분 2부작이고, 시즌 중간에도 진지하고 긴 에피소드는 2부작으로 방송했습니다. 시즌 72부작이 없었는데, 시즌이 반으로 잘린 탓이 크겠죠.

 

  최근 팬들이 정보를 모으고 모아서 시즌 11 에피소드 감독을 알아냈습니다. 감독이 연이어 같은 에피소드를 맡는다면, 그 에피소드는 2부작일 확률이 높겠죠? 시즌 11에서 2부작으로 나올 에피소드는 2, 3화와 9, 10화로 추측됩니다. 시즌 11은 에피소드 수가 10개로 줄어서 2부작은 없을 줄 알았는데 말이죠. 과연 제작진이 10 에피소드를 모두 재미로 꽉꽉 채워줄지 기대해 보겠습니다.

 


넷째. 조디 휘태커 시즌11은 웅장할 것.’



  얼마 전 영국에서는 텔레비전 시상식 BAFTA가 열렸습니다. BAFTA 레드카펫에 선 조디 휘태커가 인터뷰를 남겼습니다. 시즌 11은 영화 같으면서(cinematic) 웅장할(epic) 것이라면서 팬들의 기대감을 높였죠.

 

  저는 아직 조디 휘태커의 연기를 본 적이 없습니다. 브로드처치도 안 봤고요. 그런데 이번 인터뷰를 보니 조금 자신감이 생깁니다. 당돌하면서도 닥터에게 필요한 천진한 똘끼(?)’가 배우에게 흐르는 것 같습니다. 닥터가 여자로 바뀌면서 여성 특유의 스테레오타입(고분고분하거나 그 반대급부로 너무 까칠하거나)에 잡히지 않을까 생각했는데, 닥터 캐릭터를 기운차게 밀고 나갔으면 좋겠습니다.

 

 

반응형
  Comments,     Trackbacks
엑셀로 통계하기 외전 - 어느 모바일 게임
반응형






  철수는 지난주에 나온 모바일 게임 차일드 오브 데스티니의 광팬입니다. 여타 모바일 게임처럼 차일드 오브 데스티니도 가챠 시스템으로 아이템을 얻습니다. 가챠가챠(일본어로 철컥철컥)에서 유래한 가챠는, 쉽게 말해 뽑기입니다. 아이템을 얻으려면 일정 금액을 내고 아이템을 추첨합니다. 귀한 아이템일수록 추첨하는 데 돈도 많이 들어가고, 확률도 적습니다.

 

  오늘 철수는 풀이 죽었습니다. 정말 가지고 싶은 아이템이 있었는데, 용돈을 전부 쏟아부어도 나오지 않았기 때문입니다. 게임 개발사는 아이템이 나올 확률이 1.44%라고 말했고 철수는 100번을 시도했지만 당첨하지 못했습니다. 확률 1.44%100번 시도하면, 기댓값이 1.44인데 말이죠.

 

운이 없던 거야.’

 

  철수도 기본교육을 받아서 기댓값을 무턱대고 믿진 않습니다. 기댓값이 1을 넘더라도 재수가 없으면 안 나오니까요. 철수는 다른 사람은 어떤지 보려고 인터넷에 들어갔습니다.

 

  그런데 웬걸. 생각보다 아이템을 얻은 사람이 너무 적었습니다. 여기저기서 의견을 종합해 보니, 총 시도는 5000. 그중 아이템은 42번 나왔습니다. 5000번 중 42번은 0.84%. 아무리 게이머들이 재수가 없다지만 1.44% 확률에서 0.84%가 나올 수 있을까요?

 

 

모비율 가설 검정

 

  데이터는 강수량, 월급처럼 숫자로 나오기도 하지만 /아니오처럼 둘 중 하나로 갈리기도 합니다. 예를 들어 대학생들에게 성별을 물을 수 있겠죠.


 

  대학생들이 너무 많아서 전부 묻지 못한다면, 일부만 뽑아서 물을 수밖에 없습니다. 대학생 100명을 뽑아서 표본을 만들어 성별을 묻습니다. 남학생이 56, 여학생이 44명으로 나왔습니다. 그러나 대학생 전부가 56 44일까요?

 

  지난 시간에 우리는 표본평균의 표본분포로 가설을 검정했습니다. 귀무가설과 대립가설을 세워 모평균이 어떤 값 이상이다/아니다’, ‘이하다/아니다라 가정하고 표본평균과 표준편차(모집단이든 표본이든)p값을 구했습니다. p값이 유의수준보다 작으면 그 귀무가설을 기각했고 크면 귀무가설을 기각할 수 없었습니다(2종 오류 때문).

 

  이제 모비율 p를 검정해서 철수의 호기심을 만족해 줍시다.





 

  일단 차일드 오브 데스티니에서 아이템을 뽑는, 이른바 가챠시행은 베르누이 시행이라고 가정합니다. 가챠의 결과는 성공과 실패 단 두 가지고, 성공률은 불변이며, 모든 가챠 시행은 독립이라고 합시다.

 

  게임 개발사가 공지한 아이템 확률은 1.44%(0.0144)입니다. 철수는 표본 5000가지를 모았고 그중 42번이 성공했습니다. 표본비율은 0.0084가 됩니다. 철수는 모비율에 대한 귀무가설과 대립가설을 세웠습니다.

 

귀무가설 : 모비율은 1.44% 이상이다.

대립가설 : 모비율은 1.44% 미만이다.

 

  철수는 유의수준을 0.01로 잡았습니다. 표본비율이 1.44% 미만이므로, p값만 유의수준보다 낮다면 귀무가설을 기각할 수 있게 됩니다.

 

  모평균을 검정할 때는 정규분포(모표준편차를 알 때)t분포(모표준편차를 모를 때)를 썼습니다. 모집단이 정규분포를 따르면 표본평균의 표본분포는 정규분포를 따릅니다. 모집단이 정규분포를 따르지 않더라도, 중심극한정리에 따라 표본평균의 표본분포는 표본 크기가 크다면 정규분포를 따릅니다.


  이항분포는 어떨까요? 이항분포에서 표본이 어느 정도 크다면 표본비율의 표본분포는 정규분포에 근사합니다. ‘어느 정도는 사람마다 다르지만, 이번 게시물에서는 이 기준을 사용합니다.

 

np5이고 n(1-p)5일 때.

(n : 표본 크기, p : 성공률)

 

  표본 크기는 5000, (개발사가 주장하는) 성공률은 0.0144이므로 두 식을 전부 만족합니다. 따라서 표본비율의 표본분포는 정규분포에 근사합니다. 이 분포의 중심은 0.0144, 표준편차는 공식에 따라 0.001685입니다.

 

  일단 우리는 모집단 표준편차를 모릅니다. 따라서 t분포를 사용할 겁니다. 여기에 들어갈 변환값은 (0.0084-0.0144)/0.001685 = 3.56입니다. 이제 자유도가 n-1=4999t분포에서 3.56보다 작을 확률, p값을 구하면 끝입니다.



 

  엑셀 계산 결과 p값은 약 0.000186. p값이 유의수준 0.01보다 작으므로 모비율이 0.0144 이상이라는 귀무가설을 기각하겠습니다.

 

 


뒷이야기


  이 검정은 어느 정도 실화 기반입니다. 이름을 말할 수 없는 모 게임이 확률을 조작했다는 논란에 휩싸였죠. 개발사가 공지한 확률은 1.44%였지만 5000번이 넘는 시행에서 고작 42번 아이템이 나온 것입니다.

 

  물론 이 게시물과 실제 사례는 다릅니다. 게임 속 가챠는 베르누이 시행이 아니었습니다. 시행이 완전히 독립적이지 않았거든요. 게다가 이항분포는 정규분포와 다릅니다. 표본이 아주 커서 분포를 정규분포에 근사해서 계산했지만, 실제 이항분포를 바탕으로 계산하면 계산 결과가 다를 겁니다.




 

 

반응형
  Comments,     Trackbacks
엑셀로 통계하기 15 - 유의성 검정(2)
반응형




지난 시간에는 귀무가설과 대립가설,

귀무가설을 기각할지 말지를

p값을 이용해서 알아보았습니다.


지난 시간에는 모표준편차를 안다고 가정하고 계산했지만

이번에는 모표준편차를 모르는 때를 알아봅시다.



구간추정에선 모표준편차를 알 때/모를 때를 구분했는데,

모를 때는 모표준편차 대신 표본 표준편차를 사용했습니다.

표준정규분포 대신 자유도에 따른 t분포를 사용했고요.


 

이번에도 같습니다.

모표준편차는 표본 표준편차로 대신해서

표본분포 표준편차를 구합니다.


 

모표준편차를 알 때는 표본평균의 표본분포를 그렸는데,

이번에는 자유도가 n-1t분포를 그립니다.

 


z값을 구하듯

(표본평균 가정한 모평균)/표본분포의 표준편차

를 계산합니다.

 



예를 들어

귀무가설 : μ≤3

대립가설 : μ>3

n = 50

표본평균 = 3.1

표본 표준편차 = 1.1

유의수준 = 0.05

일 때, 귀무가설을 기각해야 할까요?

 



t값은 (3.1-3)/ 1.1/50 = 0.64입니다.


 

자유도가 50-1= 49t분포에서

0.64보다 클 확률은 얼마일까요?

 


엑셀 T.DIST 함수를 이용해서

t분포 값을 계산할 수 있습니다.

 

=T.DIST( x , 자유도 , T/F)

TRUE : 누적

FALSE : 확률밀도값


 

=T.DIST(0.64 , 49 , TRUE)

0.73입니다.

 

t값이 유의수준보다 크므로

귀무가설을 기각할 수 없습니다.

반응형
  Comments,     Trackbacks