설찬범의 파라다이스
글쓰기와 닥터후, 엑셀, 통계학, 무료프로그램 배우기를 좋아하는 청년백수의 블로그
엑셀 (60)
3화. 엑셀 텍스트 불러오기
반응형




와, 바람!





끝이 없을 것 같은 폭염도 끝났네

물론 햇볕은 아직 짱짱하지만

폭염에 비하면 냉장고나 마찬가지지.



30도가 넘는 날씨만 겪다가

조금 더운 날씨가 되니

오히려 쌀쌀한 걸.





이런 날일수록 감기를 조심해야지.






할머니, 저승도 계절과 날씨가 있나요?






딱히 있지는 않아.

사계절과 날씨는 변화의 일종.

살아있어야 변화도 겪는 법이란다.





그런가요?






뭐, 요즘 죽은 사람들은 심심해서

수영장이랑 스키장을 지어달라고

염라대왕께 요청하는 모양이다만.






'저승에 스포츠시설을 지으면

구급요원은 필요 없을지도...'








그나저나 민수야.

오늘은 아주 쉬운 엑셀 기술을

들고 왔단다.





그게 뭐죠?






바로 불러오기 기능이지.






불러오기는 저도 할 줄 아는데요.






엑셀에서 엑셀 파일은

아무나 불러올 수 있어요.



하지만 메모장 텍스트 파일이라면 어떨까?






텍스트 파일을 엑셀에요?

음, 어디서 들어본 것 같기도 하고.






예를 들어 실험실에서 자료를 입력해야 하는데

그곳 컴퓨터에 엑셀이 없다고 가정해 보자.



시간은 촉박해서 설치할 시간은 없어.

그럴 땐 메모장에 자료를 적고

나중에 엑셀로 불러와야겠지.





일리가 있네요.

근데 메모장에는 셀이 없는데요.

엑셀은 이걸 어떻게 구분하죠?






크게 세 방법이 있지.


첫째는 띄어쓰기.

둘째는 쉼표.

셋째는 탭(tab)키란다.







어? 전 이런 걸 상상했어요.



칸마다 위치를 같게 맞추면

인식이 쉬울 줄 알았는데...





물론 그 방법도 된다.

그걸 넷째로 하자꾸나.




파일 - 열기를 누르고

파일 형식을 '텍스트 파일'로 정하면

텍스트를 불러올 수 있단다.


* 가능한 확장자는

txt, prn, csv입니다.





* 데이터 - 외부 데이터 가져오기도

기능은 똑같습니다.





텍스트 파일을 선택하면

텍스트 마법사가 나타나는데

세 단계를 거쳐야 한다.






마법사... 세 단계를 거쳐야...



판타지 소설 같네요.







첫 단계는 분리를 선택하는 거다.




쉼표, 탭, 띄어쓰기로 구분하면

'구분 기호'를,

아까 너처럼 똑같은 위치에 놔뒀으면

'너비가 일정함'을 고르렴






2단계는 구분 기호를 고르는 거란다.

정확히 무엇으로 구분했는지 선택하렴.




밑에 구분 미리보기가 나오니까

보면서 고를 수 있단다.





1단계에서 '너비가 일정함'을 골랐으면요?





그럼 2단계에서 구분선 위치를 정한단다.

웬만하면 엑셀이 잘 정하지만,

잘못되었으면 바로잡으렴





마지막 3단계는 데이터 서식을 정한단다.

텍스트가 숫자인지 문자인지 날짜인지...

나중에 정해도 되겠지만

지금 정해두면 편리하겠지.






이 모든 과정을 끝내면

자료가 새 엑셀파일로 나타난단다.





* 데이터 - 외부 데이터 가져오기를 쓰면

3단계 이후 불러올 위치를 고를 수 있습니다.






좋아요, 할머니.

이번에도 엑셀 지식이 확 늘었어요!

반응형

'엑셀 > 엑셀 할머니 시즌 2' 카테고리의 다른 글

2화. 그림으로 그래프 그리기  (0) 2018.08.01
1화. 엑셀 별점 만들기  (0) 2018.07.04
  Comments,     Trackbacks
2화. 그림으로 그래프 그리기
반응형





아.. 덥다.

겨울엔 추워서 고생, 여름엔 더워서 고생.

단군이 터를 잘못 잡아도 한참 잘못 잡았네.

홍익인간이 설마 더워서 벌게진 사람인가?





컴퓨터 방은 들어가기도 싫다.

발열이 왜 이리 심한 거야?

한증막이 따로 없다니까...





으악! 할머니!

여기서 뭐 하세요?





심심해서 왔지.





그러고 보니 할머니.

영혼은 어디든 갈 수 있지 않나요?





원하는 곳은 아무데나 갈 수 있지.





그럼 외국도 가 보셨나요?





물론이지.

일본, 베트남, 호주, 러시아...





여행도 여행이지만

산 사람이 못 가는 곳도 가 보셨어요?

세계적인 미스터리를 풀 수 있을 텐데요.





버뮤다 삼각지대, 체르노빌.

백악관 지하에 정말 비밀기지가 있는지

남미 어딘가에 있는 마야 도시를 찾고..





아! 혹시 우주도 갈 수 있나요?

화성에 생명체를 찾으면 참 좋을 텐데...





...너한텐 이 할미가 수색대원으로 보이는구나.





쓸데없는 호기심은 그냥 접고

엑셀 비법이나 하나 배우렴.





오늘은 뭔가요?





엑셀 막대그래프(차트)를 보면

막대 색을 정할 수 있지?





네, 처음 만들면 늘 파란색이죠.









이걸 그림으로 대신 만들고 싶지 않니?

이렇게 말이다.






오. 그래프 축이 하트모양이 됐어요.

멋진걸요.





만드는 방법을 바로 알려주마

우선 넣을 그림이 필요하겠지?





여기 하트 그림 있어요.





좋다. 그래프를 하나 만들어라.





여기요.








축을 한 번 누르면

모든 축이 전부 선택된다.





오른쪽 마우스를 클릭해

'데이터 계열 서식'을 누르면

오른쪽에 서식메뉴가 나타나지.





왼쪽 '채우기 및 선'을 눌러

채우기 - 그림 또는 질감 채우기를 누르렴





'다음에서 그림 삽입' 밑에 있는

'파일'을 눌러 불러오고 싶은 그림을 불러오면 된단다.





어? 그림이 세로로 늘어났는데요?





밑에서 '늘이기' 대신 '쌓기'를 누르면

우리가 원하는 그래프가 나온단다.






음. 쉽네요.

그래프 축이 그림이면 확실히 보는 재미가 있겠죠?



반응형

'엑셀 > 엑셀 할머니 시즌 2' 카테고리의 다른 글

3화. 엑셀 텍스트 불러오기  (0) 2018.08.17
1화. 엑셀 별점 만들기  (0) 2018.07.04
  Comments,     Trackbacks
엑셀 할머니 시즌 1
반응형

  어떻게 하면 엑셀을 쉽게 설명할 수 있을까 고민했습니다. 떠오른 해답은 '대화체'였죠. 교과서처럼 늘어놓기보다는 한 사람이 설명하고 다른 사람이 질문하며 이해하는 식이 좋다고 생각했습니다. 엑셀 할머니는 그런 아이디어로 태어났습니다.


  왜 돌아가신 증조할머니를 떠올렸는지는 모르겠습니다. 약간의 블랙 코미디라고 보시면 될 것 같습니다. 엑셀이 뭔지도 모르고 살다 간 사람이 현재 젊은 사람보다 엑셀을 더 많이 안다? 거기에 저승에 있는 사람이라면 이런저런 이야기를 꺼내기 좋을 겁니다.


  좋은 글도 있고, 나쁜 글도 있습니다. 조금씩 고쳐나갈 생각입니다.




1화 - 상대참조와 절대참조

2화 - 평균내기

3화 - 가중평균

4화 - 기하평균과 평균성장률(+조화평균)

5화 - 최빈값과 중앙값

6화 - 반올림, 배수로 반올림

7화 - 행과 열 바꾸기

8화 - 분산과 표준편차

9화 - 요일 표시하기

10화 - PDF파일을 엑셀로 변환하기

11화 - 체크박스 만들기

12화 - 드롭다운 단추(목록만들기)

13화 - 엑셀 부가세를 구해보자

14화 - 엑셀 고급필터

15화 - 엑셀 FREQUENCY 함수

16화 - 엑셀암호 걸기

17화 - OFFSET 함수와 응용

18화 - 엑셀 FIND함수와 응용

19화 - 엑셀 사진 삽입하기

20화 - 엑셀 ROW와 COLUMN으로 셀 주소 알아내기

21화 - 엑셀 만나이 계산하기

22화 - 엑셀 함수 만들기

23화 - 엑셀 가나다순 정렬

24화 - 엑셀 로그

25화 - 엑셀 목표값 찾기

26화 - 스파크라인이란?

27화 - 엑셀 스파크라인 만들기


외전 1화 - WEEKDAY 함수(+CHOOSE)

외전 2화 - 엑셀 할인율

외전 3화 - 엑셀 vlookup 함수(+index, match)

외전 4화 - 엑셀 CONCATENATE 함수


반응형
  Comments,     Trackbacks
엑셀 VBA 레시피 - 시작하기
반응형






  안녕하세요. 나는 Gustave Alvarado다. 프랑스 식당 주인이다. 사람들 물어본다 왜 내 성씨 스페인인가. 내 할아버지는 마드리드에서 왔다. 그는 요리 매우 잘 했다. 할머니 그가 프랑스에서 만난 채식주의자였다. 할아버지가 그녀를 고기 먹게 만들었다 뛰어난 요리 실력으로. 나도 그처럼 되고 싶다.





  사람들은 나한테 요리 어떻게 하는지 물어본다. 난 서점 가서 사라고 말한다. 음식을 만드는 것 그리고 요리하는 법 가르치기 다르다. 너들은 기초에서 배워야 한다. F1 운전자 찾아가서 물어보지 말아라 면허 얻기 전에. 다행히 나는 엑셀 잘하지 않는다 내 요리하는 만큼. 그런 이유로 여러분을 가르침이 가능하다. 지금 우리는 동업자다 그러므로 불러라 나를 Gustave라고.






  나는 조금 한국인 여기서 만난다. 한국 관광객들은 항상 말한다 취업하기가 어렵다. 지난번에 만난 소녀 대학에서 철학 수강해 왔다. 교양으로 풍부한 여자 그러나 직업 얻지 못했다. 그녀는 표정을 찌그러뜨렸다 말하며 "마이크로스프트 엑셀 배운 사람이 나보다 사회에 더 쓸모있다." 나는 그녀 불쌍히 생각한다. 하지만 철학은 똑똑한 것인데 어떻게 그녀는 예상하지 못했는가 철학이 직업을 주지 않는 것?







  진짜 기술은 인생에 중요하다. 여러분은 그걸 배워야 한다. 먹고사는 것 한 가지 실력만으로, 아주 큰 실력 필요하다. 당신은 세계적이어야 할 것이다. 만약 아니라면 당신은 여러 가지 배워야 한다. 엑셀이 그들 중 한 명이다. 많은 경영자들 내 식당에 방문하는 불평한다 엑셀 배우면 많은 편함 찾을 수 있다.







  당신은 서점에 갈 수 있다 그리고 많은 엑셀책들 찾는다. 초보를 위함, 회사를 위함, 그냥 취미를 위함... 무엇이든 당신이 보는 것, 그들은 각자 주제를 가진다. 그러므로 나도 하나 가진다. 내 테마는 VBA다. 내가 친구에게 물어볼 때, 그들은 손을 저었다. "VBA는 프로그래밍 사람만을 위한다." 그러나 나는 VBA 멋있음을 발견했다. 요리와 달리, 괜찮다 엑셀 망치는 것. 재료를 낭비하지 않는다. 누가 식중독 발병하지 않는다(네가 아니 회사에서 보고서 쓸 때).






  학습은 재밌다. 학습은 살기 위한 힘을 준다. 음식은 시간이 갈수록 부패한다, 그러나 지식은 반대로 숙성한다 마치 와인처럼. 그래서 배워보자 같이. 엑셀 미공부의 결과물들아.








  VBA는 Visual Basic for Application를 위해 선다. Visual Basic은 컴퓨터를 위한 말이다. 당신이 영화 볼 때 매트릭스처럼, 많은 0과 1이 보인다. 그것이 어떻게 컴퓨터가 일하는지다. 그러나 0과 1만 쓰는 것 너무 복잡하다. 여러 컴퓨터 전문가들이 컴퓨터 언어 만들었다. 그걸 사용함, 더 편하게 일한다. Visual Basic이 그중 하나다. Application은 쉽다. 휴대폰을 집어라. 당신은 휴대폰에 있는 프로그램을 본다. 요즘 아이들은 그걸 부른다 App이라고. 안전하다 Application을 App이라고 보는 것.






  우리는 Excel을 공부하기 때문, Application은 Excel을 의미한다. 그래서 VBA는 Excel을 위한 컴퓨터 말이다. 무슨 뜻인가?






  당신은 식당에 가서 메뉴를 든다. 하나를 고른다. 시킨다. 종종 추가 주문한다. '덜 익힘 원한다.' '양파를 더 넣어라.'. 내 식당에 만족하지 않으면(난 노력한다 이것이 불가능하다) 당신은 요리를 배우고 직접 요리한다. 메뉴에 없는 밥을 만든다.






  Excel 거대한 기능 가진다. 함수들, 그래프들... 그러나 가끔 당신은 못마땅하다 Excel 것들. 그것이 시작이다 당신이 VBA를 작동하는. VBA는 자유로운 Excel이다. 함수를 만들어라, 기능 사용해라 제공하지 않는. 버튼을 누르고 셀을 정렬한다? 새 창을 띄워 자료를 넣어라? 가능하다 VBA 안에서는!






  아무튼 나는 Excel 2016년과 일한다. 단축키는 Alt + F11이다. 화면 위에 개발 도구 누르고 왼쪽에 있는 Visual Basic 클릭도 가능하다. 만약 개발 도구 없으면 파일 - 옵션 - 리본 사용자 지정 들어가라. 개발 도구 네모에 체크하고 확인 누른다.






  VBA에 들어가면 많은 메뉴 있다. 놀라지 말아야 한다. 우리는 조금만 건드릴 것이다. 삽입 - 모듈을 누른다. 흰 화면이 생긴다. 당신은 여기에 글씨를 쓸 수 있다. 물론, 알맞은 단어를 넣어야 한다. 컴퓨터 나라에 온다면, 컴퓨터 말 써라!


  다음 시간에 나는 조금 기초적인 VBA 해볼 것이다. 좋은 운!

반응형
  Comments,     Trackbacks
1화. 엑셀 별점 만들기
반응형





. 방학이다.

날은 더워지고, 몸에 힘은 빠지고.

 


그러고 보니 엑셀 활용법을 가르쳐 주시던

증조할머니도 안 오시네.

많이 바쁘신가?

 


노느라 바쁘다. 노느라.



 

깜짝이야!

할머니! 어디 계셨어요!

 


당연히 저승에 있었지.

더워서 나도 쉬다가 왔다.

 


저승에서도 휴가를 가나요?

(아니, 죽어도 더위를 느끼나?)

 


그럼 종일 뭐 하니?

귀신은 잠도 안 자는데.


 

어디로 가나요?




 


남들 가는 대로 가지.

산과 바다와 별장으로.

이승 사람들 마주치기 싫어서

조용하고 외딴곳이 인기란다.

 


(그래서 폐가와 폐건물에

귀신 목격담이 많은 걸지도.)


 

아직도 엑셀이 고민이니?


 

아뇨. 방학인걸요.

올해는 휴학하면서 이것저것 경험하려고요.




좋다.

안 그래도 엑셀공부를

조금 달리할 생각이었다.


 

달리한다니 어떻게요?



 

복잡한 기능보다는

멋있고 재밌는 기능 위주로

가르치고 싶었다.

 


엑셀이 멋있으면 얼마나 멋있다고요.

 


예끼! 요즘은 멋있어야 사는 시대야.

할머니 어렸을 때는 가난해서

일만 해내면 쓸만한 사람이라 했어요.



 

일은 잘하는 게 맞죠.

 


세상은 다투어서 이기는 곳.

남보다 잘하지 못하면

아무리 잘해도 진 것과 다름없어.

 


(으으)좋아요.

오늘은 뭘 배우죠?

 


민수는 별점이라고 들어 봤지?

 


별점이요?

영화잡지 같은 곳에서

영화에 점수를 매길 때 쓰는 방식 아닌가요?


 


주로 별 넷이나 다섯을 만점으로

영화 등급을 매기죠.

 


그래.

미슐랭 가이드는 식당을 별 셋 만점으로 표현하지.

 


영화와 레스토랑에 쓰는 별점이

엑셀과 무슨 상관이죠?

 


오늘은 말이다.

엑셀을 써서

점수를 별점으로 바꾸는 방법을

알아보자꾸나.

 


점수를 별점으로 바꾸기



 

별은 모두 열 개,

점수만큼 검은 별

나머지는 하얀 별을 넣자.

 


10점은 별 하나.

20점은 별 둘.

이렇게요?

 


그래.

1의 자리는 버리자꾸나.

예를 들어,

55점은 별 다섯을 쓰는 거다.

 


10의 자리만 보자는 건데.

점수를 10으로 나누고

소수를 버리기만 한다면.

 




엑셀에는

QUOTIENT 함수가 있단다.


QUOTIENT

나눗셈 몫의 정수부분만 반환하는 함수

=QUOTIENT(숫자, 나눌 수)


EX> QUOTIENT(17, 4) → 4

(17÷4 = 4.25이므로)

 


10으로 나눠 정수만 남길 수 있겠네요.

555,

797이 되겠죠.

 


좋아.

그럼 그 수만큼 별을 써야겠지?



 


문자를 바라는 대로

쓰는 함수는 없나요?

 


REPT함수가 그 주인공이다.


REPT

문자는 횟수만큼 반복해 쓰는 함수

=REPT(문자, 횟수)


EX> REPT("가", 5) → 가가가가가

 


좋아요.

검은 별은 아까 구한 수대로 쓰고

흰 별은 10에서 그 수를 빼서 쓰면 되겠죠?




 

두 문자열을 붙이는 함수는

CONCATENATE란다.


CONCATENATE

여러 문자열을 합치는 함수

=CONCATENATE(문자열, 문자열 …)


EX> =CONCATENATE("토","마","토") → 토마토

 


좋아요. 완성했어요!

 




=CONCATENATE(REPT("", QUOTIENT(셀 주소,10)), REPT("", 10-QUOTIENT(셀 주소,10)))

 

참고. 별표는 ‘ㅁ’을 누르고 한자를 눌러서 불러옵니다.

 




완벽하네요!

 

 

 

별 다섯이 만점인 별점은

10 대신 20으로 나누고

흰 별은 5에서 빼면 되겠지.

반응형

'엑셀 > 엑셀 할머니 시즌 2' 카테고리의 다른 글

3화. 엑셀 텍스트 불러오기  (0) 2018.08.17
2화. 그림으로 그래프 그리기  (0) 2018.08.01
  Comments,     Trackbacks
하루 30분) 엑셀 고급필터
반응형




  고급 필터는 자료를 조건에 맞게 걸러내는 기능입니다. 원래 표에서 원하는 부분만 남길 수도 있고 다른 곳에 표를 다시 만들 수도 있습니다. 원하는 부분만 남기면 나머지는 사라지지 않고 생략됩니다. 이번 포스팅은 다른 곳에 표를 만들어 보겠습니다.

 

  고급 필터 쓰는 법 간단하게



1) 조건식을 빈 곳에 쓴다.

2) 데이터 리본 - [정렬 및 필터] - [고급]을 누른다.

3) 목록 범위는 자료로 정한다.

4) 조건 범위는 1에서 쓴 조건식으로 정한다.

5) 바라는 곳을 복사 위치로 한다.

(‘다른 장소에 복사를 선택했다면)

6) 확인을 누른다.

(자세한 건 예제와 함께)



 

주의. 목록 범위는 자료 제목도 들어가야 합니다.

 


조건식 쓰는 법 - 간단하게



1) 조건을 가리는 항목을 쓴다.

2) 그 밑에 조건을 쓴다.

3)

(자세한 건 예제와 함께)



시작하기 전에 예제파일 받아가세요!


하루 30분 고급필터.xlsx




우리만의 약속



첫째. 예제 파일로 한 번씩 예제 연습하기

둘째. 아리송하면 복습하기

셋째. 부담 없이 잔잔히 즐기기



* 이 포스팅은 엑셀2016을 기반으로 썼습니다.




예제 1) ‘중간고사50 이상인 행을 표시할 것



중간고사

>=50

 


 

예제 2) ‘성별이 여자인 행을 표시할 것




성별

여자



 

 

조건이 여럿일 때



여러 조건이 있다면 AND인지 OR인지 잘 판단해야 합니다.

 

AND : 여러 조건을 동시에 만족해야 함

OR : 여러 조건 중 하나라도 만족하면 됨

 

성별이 여자고 점수가 50점 이상은 여자와 50점 이상을 모두 만족해야 하므로 AND입니다. ‘성별이 여자거나 점수가 50점 이상은 둘 중 하나만 만족하면 조건에 맞으므로 OR입니다.

 

외우자. AND는 같은 줄에 OR은 다른 줄에!

 




예제 3) ‘성별이 남자고 나이50 이하인 행을 표시할 것




성별 나이

남자 <=50



 


예제 4) ‘성별이 남자거나 나이50 이하인 행을 표시할 것



      성별    나이

남자  

              <=50



 

 

원하는 열만 나타내고 싶을 때



바라는 제목들을 입력하고 복사 위치로 지정한다.

 


예제 5) ‘중간고사70점 이상인 행을 이름, 나이, 등록일만 표시할 것



① 미리 원하는 항목을 써둔다



② '복사 위치'를 이 항목들로 한다.





 

예제 6) ‘이름가 들어가는 행만 표시할 것



조건

=FIND("", B3)>=1



 

이름이 아니라 조건이죠?

  고급 필터 조건에 함수나 계산값을 쓰고 싶으면 원본 자료에 없는 제목을 쓰거나 비워야 합니다!

 



참고. 제목을 비워도 조건 범위는 빈칸까지 넣어야 합니다.

 

 

예제 7) ‘등록일7월인 행을 표시할 것



조건

=MONTH(E3)=7



 

 

예제 8) ‘등록일2월이거나 10월인 행을 표시할 것



                           조건 1                     조건 2

=MONTH(E3)=2

                                                              =MONTH(E3)=10

 


 

예제 9) ‘등록일의 일이 10 미만인 행을 표시할 것



조건

=DAY(E3)<10

 


 

예제 10) ‘성별이 남자가 아닌 행을 표시할 것



~가 아닌 조건은 <>가 좋습니다.

 

성별

<>남자

 


 

예제 11) ‘기말고사기말고사평균 이상인 행을 표시할 것


조건

=H3>AVERAGE($H$3:$H$22)

 





 

예제 12) ‘중간고사’, ‘기말고사가 전부 70 이상인 행을 표시할 것



 

첫 번째 방법

중간고사  기말고사

>=70    >=70

 

두 번째 방법

COUNTIF 함수는 조건에 맞는 수를 구하는 함수입니다.

70 이상을 만족하는 점수가 둘인 행을 찾게 합시다.

 

조건

=COUNTIF(G3:H3, ">=70")=2





예제 13) ‘기말고사중간고사보다 높은 행을 표시할 것



조건

=G3<H3

 


 

예제 14) ‘회원번호세 번째 글자가 6 이상인 행을 표시할 것



 

조건

=MID(F3, 3, 1)*1>=6

 



참고. LEFT, MID, RIGHT 함수는 글자를 텍스트로 빼내는 함수입니다. 텍스트를 숫자로 바꾸기 위해 *1을 해줍니다.

 


예제 15) ‘기말고사상위 5등을 표시할 것



LARGE 함수를 응용합니다.

LARGE는 범위에서 ~번째로 큰 값을 반환합니다.

 

조건

=H3>=LARGE($H$3:$H$22, 5)

 



참고. LARGE 함수의 반대는 SMALL입니다.

SMALL은 범위에서 ~번째로 작은 값을 반환합니다.

 

 

여러 조건 한 셀에 쓰기



여러 조건은 나누어 써야 쉽지만, 시험에서 한 줄, 한 셀에 다 쓰라고 시키는 때도 있습니다. 이땐 ANDOR 함수를 써야 합니다.

 



예제 16) ‘성별이 여자고 중간고사30점 미만인 행을 표시할 것(조건은 셀 하나에 쓸 것)




조건

=AND(C3="여자", G3<30)

 



예제 17) ‘나이30 미만이거나 50 초과면서, '중간고사''기말고사'가 모두 80 이하인 행을 표시할 것(조건은 셀 하나에 쓸 것)



조건

=AND(OR(D3<30,D3>50),AND(G3<=80,H3<=80))

 



참고. 조건이 복잡할수록 큰 틀부터 짜맞춥시다.

반응형

'엑셀 > 하루 30분 엑셀카페' 카테고리의 다른 글

하루 30분) 엑셀 조건부 서식  (1) 2018.07.02
  Comments,     Trackbacks
하루 30분) 엑셀 조건부 서식
반응형



  수많은 자료 중에서 원하는 자료만 색을 바꾸거나 굵은 글씨로 만들 수 있다면 얼마나 좋을까요. 한눈에 들어와서 보기도 좋고 쓰기도 좋을 겁니다. 엑셀 조건부 서식은 실용성도 좋지만 컴활 자격증 시험에서 물어보기도 하니 꼭 알아둬야 하겠죠.

 

  엑셀은 이미 여러 조건부 서식을 지원합니다. ~보다 높은 숫자나 상위 몇 퍼센트를 강조하는 식이죠. 기본 내용은 예전 포스트에서도 설명했으니 이번엔 수식을 직접 입력해서 조건부 서식 고수가 되어 봅시다.

 


시작하기 전에 예제 파일 받아가세요!


조건부서식-엑셀카페.xlsx




우리만의 약속


첫째. 예제 파일로 한 번씩 예제 연습하기

둘째. 아리송하면 복습하기

셋째. 부담 없이 잔잔히 즐기기



* 이 포스팅은 엑셀2016을 기반으로 썼습니다.

* 밑 조건식을 그대로 붙여넣기 하면 작동하지 않았습니다. 까닭은 모르지만 참고만 하시고 손수 쓰시기 바랍니다.

 



범위 정하기



  조건부 서식 규칙을 만들기 전에 조건을 적용할 셀들을 지정합니다.

드래그로 범위를 정합니다.

 



주의. 제목 셀은 범위에 넣지 않습니다!

 


조건부 서식 시작하기




  범위를 정하고 홈 리본에 있는 [조건부 서식]을 클릭합니다.

[새 규칙]을 누르고 수식을 사용하여 서식을 적용할 셀 결정을 누릅니다.




  밑에 입력창이 하나 생깁니다. 이곳에 규칙을 입력합니다.


  '서식'에서는 규칙에 맞는 셀에 어떤 서식을 줄지 정합니다. 이번 포스트에서는 전부 하늘색으로 셀을 칠하겠습니다.



 

 



예제 1) 나이가 50세 이상인 사람의 행을 칠할 것



=($D3>=50)





주의. 규칙을 입력할 때 방향키를 누르면 셀 주소가 나타납니다. 입력 커서는 마우스로만 움직입시다!

 

 




예제 2) 남자인 행만 칠할 것



=($C3="남자")



 

참고. C열이 남자가 아닌 행은 조건식이 뭘까요? <>를 씁니다.


=($C3<>"남자")

 


 

예제 3) 회원번호 첫 글자가 A인 사람의 행을 칠할 것



엑셀 LEFT 함수는 셀 텍스트를 왼쪽부터 추출하는 함수입니다.

(LEFT 함수의 첫 인수는 셀 주소둘째 인수는 추출할 글자 수입니다)

 

=(LEFT($F3,1)="a")





참고. 셀 텍스트를 오른쪽부터 추출하는 함수는 뭘까요?

, 맞습니다. RIGHT 함수입니다.

 

 

예제 4) 회원번호 두 번째 글자가 5 이상인 행을 칠할 것



  셀 텍스트를 중간부터 추출하는 함수는 MID입니다.


MID(셀 주소, 추출을 시작할 글자, 추출할 글자 수)

(이 경우에는 셀 주소, 2, 1이겠죠)

 

=(MID($F3, 2, 1)*1>=5)



 

잠깐! ‘*1’이 있죠?

  LEFT, MID RIGHT 함수는 셀 글자를 텍스트로 추출하는 함수입니다. 아무리 숫자를 빼냈어도 텍스트 상태기 때문에 다른 숫자와 비교할 수가 없습니다. 따라서 *1을 해서 숫자로 바꿔야 제대로 서식이 적용됩니다.

 

 

예제 6) 행 번호가 짝수/홀수인 행을 칠할 것



행 번호를 반환하는 함수는 ROW입니다.

ISEVEN 함수는 인수가 짝수면 TRUE를 반환하고

ISODD 함수는 인수가 홀수면 TRUE를 반환합니다.

 

행 번호가 짝수인 행을 칠할 땐

=ISEVEN(ROW())

행 번호가 홀수인 행을 칠할 땐

=ISODD(ROW())



 

참고. 열 번호를 반환하는 함수는 COLUMN입니다.

 

 

예제 7) 행 번호가 3의 배수인 행을 칠할 것



MOD 는 나눗셈 후 나머지를 구하는 함수입니다.

3으로 나누어 나머지가 0이면 3의 배수겠죠?

 

=MOD(ROW(), 3)=0



 




예제 8) 등록일이 8월인 행을 칠할 것



  날짜에서 달수를 추출하는 함수는 MONTH입니다.

 

=MONTH($E3)=8



 

예제 9) 등록 날짜가 15일 이상인 행을 칠할 것



날짜에서 날짜를 추출하는 함수는 DAY입니다.

 

=DAY($E3)>=15



 

 

예제 10) 점수가 상위 10등인 행을 칠할 것



LARGE 함수는 범위에서 ~등인 값을 반환합니다. 이 함수를 응용합시다.

 

=$G3>=LARGE($G$3:$G$22,10)

해석 : 점수 범위에서 10등인 값 이상인 점수 행을 색칠





예제 11) 점수가 평균보다 높은 행을 칠할 것



평균을 구하는 함수는 AVERAGE입니다.

 

=$G3>AVERAGE($G$3:$G$22)



 


예제 12) 여자면서 나이가 40세 이상인 행을 칠할 것



이제 조건이 두 가지입니다.

두 조건을 만족하는 조건부 서식을 쓰는 법은 둘입니다.

 

첫째, AND 함수 이용

둘째, * 이용

 

=AND($C3="여자", $D3>=40)

=($C3="여자")*($D3>=40)



 

참고. AND 함수는 두 조건이 모두 맞을 때만 TRUE를 반환합니다.

 

참고. *AND처럼 TRUE*TRUE일 때만 TRUE를 반환합니다.

반응형

'엑셀 > 하루 30분 엑셀카페' 카테고리의 다른 글

하루 30분) 엑셀 고급필터  (0) 2018.07.03
  Comments,     Trackbacks
엑셀로 통계하기 20 - 모비율 비교와 독립성 검정
반응형



  통계 자료는 숫자만 있지 않습니다. 가끔은 단순히 예/아니오, 남자/여자처럼 수 대신 비율로 나타내는 자료도 있죠.

 

  이번 시간에는 모집단 비율을 비교합니다. 먼저 두 모집단 비율 차이를 구간추정/가설검정 합니다. 가설검정 이후 분산분석으로 여러 모집단 평균이 같은지 검정했듯 여러 모집단 비율의 동일성도 검정합니다. 모집단의 두 변수가 독립인지도 검정해 볼 텐데, 여러모로 모집단 비율 동일성과 비슷하니 생뚱맞지는 않을 겁니다.

 

 

모집단 비율 차이 구간추정




  두 회사 직원에게 박사학위가 있는지 물어보았습니다. 각 회사에서 100명을 뽑아 질문했습니다. 회사A100명 중 70, 회사B100명 중 60명이 박사학위 소지자로 드러났습니다. 두 회사 박사학위 소지 비율 차이에 대한 90% 신뢰구간은 어디일까요?

 

  모집단 평균 신뢰구간을 구하는 법. 생각나시나요? 표본평균에 오차범위를 빼고 더했죠. 오차범위는 신뢰수준에 맞는 z에 표본분포 표준편차를 곱했습니다.



 

  표본이 충분히 크다면 포본분포는 정규분포에 근사하죠. 그러니 모집단 비율 차이 신뢰구간도 이렇게 합시다. 표본평균 대신 두 표본비율 차이를 넣습니다. z는 표준정규분포에서 중앙 면적이 신뢰수준만큼을 차지하는 값입니다. 엑셀 NORM.S.INV 함수를 이용하면 z를 구할 수 있습니다.



z = NORM.S.INV(1-유의수준/2)

 

*신뢰수준별 z

90% - 1.645

95% - 1.960

99% - 2.576

 

  모집단 비율 차이의 표본분포 내 표준편차를 구하려면 모집단 비율을 알아야 합니다. 그런데 모르니까 구간추정을 하겠죠? 모집단 비율 대신 표본집단 비율을 넣습니다.



 

  박사학위 보유 차이에 대한 90% 신뢰구간을 구해 봅시다. 두 표본집단 비율과 표본 크기, 신뢰수준 90%에 맞는 z를 아니까 쉽게 구할 수 있습니다.


 

 

모집단 비율 차이 가설검정



 

  이번엔 두 회사 직원에게 파인애플 피자를 좋아하는지 물어보았습니다. 역시 회사마다 100명을 뽑아 질문합니다. 회사A100명 중 30, 회사B100명 중 40명이 파인애플 피자를 좋아했습니다. 두 회사가 파인애플 피자를 좋아하는 비율은 같을까요?(유의수준 0.05)

 

 

  두 모집단 평균 차이를 검정하는 법은 지난번에 다뤘습니다. 두 모집단 평균 차이가 같다, 즉 차이가 0이라는 귀무가설을 세우고 차이가 0이 아니라는 대립가설을 세웠습니다.




 

  모집단 비율 차이도 같은 식으로 시작합니다. 두 모집단 비율 차이가 0이라는 귀무가설과 0이 아니라는 대립가설을 세웁니다.

 

  이제 z를 구합니다. 문제는 표준편차인데요. 가설검정이 옳다면 두 표본비율과 모집단 비율은 같을 겁니다.



 

  그런데 모집단 비율을 알 수 없으니 표본비율로 대체해야 합니다. 어느 집단의 표본비율로 대체하라는 거죠? 두 표본집단 비율을 합친 값을 씁니다. 정확히 말하면 두 표본집단 비율의 가중평균입니다. 가중치는 표본 크기고요. 이걸 모집단 비율의 합동추정량(pooled estimation of p)라고 합니다.







 

  이제 나머지는 가설검정과 같습니다. z보다 중심에서 먼 양쪽 날개 면적이 p값입니다. p값이 유의수준보다 작으면 귀무가설을 기각합니다.

 

  엑셀에선 NORM.S.DIST 함수로 표준정규분포 꼬리 면적을 계산합니다.


p=NORM.S.DIST(Z, TRUE)

 

 

  과연 두 회사는 똑같은 비율로 파인애플 피자를 좋아할까요?






  귀무가설을 기각할 수는 없겠네요.

 

 





 

여러 모집단 비율의 동일성 검정 카이제곱 분포 이용



 

  이번엔 세 회사에서 100명을 추출해 이순신과 세종대왕 중 어느 위인을 존경하는지물어봤습니다. 과연 세 회사에서 이순신을 존경하는 비율은 전부 같을까요?(유의수준 0.05)

 

  모집단 평균 동일성을 검정할 때, 분산분석을 이용하기도 했습니다. 비교할 모집단이 셋 이상이면 분산분석은 매우 편리했죠. 이번에는 여러 모집단 비율의 동일성을 검정해보겠습니다. 이번 검정에는 카이제곱 분포가 필요합니다. 그냥 그런 분포가 있다고 알면 됩니다.

 

  분산분석처럼 이번에도 귀무가설/대립가설을 만듭니다. 귀무가설은 모든 모집단 비율이 같다는 것이고 대립가설은 하나 이상의 모집단 비율이 다르다는 겁니다.

 

  좋습니다. 이게 설문 결과입니다. 300명 중 이순신을 존경하는 회사원은 165명입니다. 비율로 계산하면 0.55네요. 귀무가설이 옳다면 세 회사에서 이순신을 좋아하는 비율은 전부 0.55일 겁니다. 그러니까 세 회사에서 100명씩 물어보면 이순신을 존경하는 사람이 55명 나왔을 거란 말이죠.

 

  이 값을 기대도수라고 부릅시다. 실제 설문에서 관찰한 값은 관측도수라고 하고요. 기대도수 공식은 다음과 같습니다. 가로합과 세로합을 생각하면 쉽습니다.






 

  이제 생각해 보세요. 귀무가설이 옳을수록 관측도수는 기대도수와 가깝습니다. 이걸 유념하며 카이제곱 검정통계량을 구합니다.

(모든 기대도수가 5 이상이어야 결과가 좋다고 합니다. 기대도수가 5 미만이라면 옆 범위와 합치라는군요.)



 

  검정통계량이라는 단어에 감이 오셨나요? 카이제곱 분포에서 이 카이제곱 검정통계량보다 큰 영역의 넓이가 바로 p값입니다. 카이제곱 분포는 자유도마다 모양이 다른데, 자유도는 k-1. 회사가 셋이니 자유도는 3-1=2입니다. 이제 p값이 유의수준보다 작으면 귀무가설을 기각하겠죠?



 

 대답이 셋 이상일 때

 

  위인을 다섯 명으로 정하고 설문조사 하면 어떻게 될까요?

 

  대답이 셋 이상이어도 기대도수와 카이제곱 검정통계량 구하는 방법은 같습니다다만 귀무가설은 모든 모집단에서 응답변수의 다항분포가 전부 같다.’가 됩니다대답이 둘이면 그냥 비율이 같다고 하면 되는데 가짓수가 늘어났으니 각 대답 비율이 모집단마다 같다.’고 해야 합니다.

 

  카이제곱분포 자유도는 (r-1)(k-1)입니다위인 다섯에 회사 셋이니 (5-1)(3-1)=8이 됩니다.




 

  엑셀에선 CHISQ.TEST 함수를 사용합니다. 첫 인수에는 관측도수 범위를 둘째 인수에는 기대도수 범위를 넣으면 자동으로 p값을 반환합니다.


=CHISQ.TEST(관측도수 범위, 기대도수 범위)



   세 회사가 똑같은 비율로 이순신을 존경하는지 CHISQ.TEST 함수를 써 보니 p값이 0.364가 나왔습니다. 귀무가설을 기각할 수 없겠네요.

 

 

모집단 비율 독립성 검정 카이제곱 분포 이용



 

  이제 회사원 100명에게 박사학위가 있는지탕수육, 피자, 돈가스 중 어느 음식을 제일 좋아하는지를 물었습니다. 과연 박사학위 유무는 좋아하는 음식과 관계가 있을까요?

 

  이렇게 독립성을 검정할 때도 카이제곱 분포를 이용합니다. 방법은 동일성 검정과 매우 비슷합니다. 똑같이 기대도수를 구하고, 카이제곱 검정통계량을 구합니다. 자유도가 (r-1)(c-1)인 카이제곱 분포에서 검정통계량보다 오른쪽에 있는 영역 넓이가 p값입니다. 귀무가설은 두 변수는 독립적이다.’고 대립가설은 두 변수는 독립적이지 않다.’입니다. p값이 유의수준보다 작으면 귀무가설을 기각합니다.

 

  이 회사원들의 박사학위와 음식 취향이 독립적인지 알아봅시다. 역시 엑셀 CHISQ.TEST 함수를 이용합시다. 기대도수를 구하고 카이제곱 검정통계량을 구했습니다. 카이제곱 분포에 넣어보니 p값이 0.8이네요. 이것도 기각할 수는 없겠네요.

 

반응형
  Comments,     Trackbacks
엑셀로 통계하기 19 - 분산분석 이원배치법
반응형



  지난 시간에는 여러 모집단 평균을 비교하는 분산분석을 수행했습니다. 인자가 하나인 일원배치법이었죠. 첨가제에 따른 제조 시간이 같은지 다른지를 판단했죠. 그런데 첨가제와 온도를 동시에 고려할 수는 없을까요? 예를 들어 첨가제 A80도 온도로 공정을 실행할 때와 첨가제 B90도 온도로 공정을 실행할 때 제조 시간이 같을까요?

 

  이렇게 인자 두 가지를 고려하는 방법은 이원배치법(Two way factorial design)이라고 합니다. 이원배치법은 반복이 없는 이원배치법과 반복이 있는 이원배치법으로 나뉩니다. 반복이 없는 이원배치법은 말 그대로 처리마다 결과가 하나입니다. 반복이 있는 이원배치법은 처리마다 여러 번 시험해서 결과도 여럿입니다. 반복이 없는 이원배치법부터 살펴봅시다.

 


반복이 없는 이원배치법


 지난 분산분석에서 자료값과 총평균의 차이를 분석한 것 생각나나요?


 

자료값과 총평균의 차이

= 처리가 달라서 생기는 차이 + 자료마다 개별로 생기는 차이

 




  공장으로 돌아가 봅시다. 첨가제와 온도를 다르게 하면서 제조시간을 쟀습니다. 첨가제는 세 종류, 온도는 두 종류가 있다고 가정합니다. 첨가제 B, 90도 자료를 보겠습니다. 이 자료와 모평균(자료 총 평균으로 모평균을 추정합니다)의 차이는 세 가지로 나눌 수 있습니다.

 

   자료값과 총평균의 차이

= 첨가제에서 생기는 차이 + 온도에서 생기는 차이 + 자료마다 개별로 생기는 차이

 

  첨가제에서 생기는 차이는 첨가제별 평균 - 총평균입니다. 온도가 달라서 생기는 차이는 온도별 평균 - 총평균입니다. 개별로 생기는 차이는 자료값에 각 인자별 평균을 빼고 총평균을 더한 값입니다. 식으로 쓰면 다음과 같습니다.




  (표본평균-총평균)의 제곱합을 처리제곱합이라 불렀습니다. 그런데 인자가 둘이라 표본평균도 첨가제별 평균, 온도별 평균으로 둘입니다. 따라서 처리제곱합도 두 가지입니다. 처리제곱합의 자유도는 각 인자수-1입니다. 첨가제 처리제곱합의 자유도는 3-1=2, 온도 처리제곱합의 자유도는 2-1=1가 되죠. 오차제곱합은 다행히 하나군요.











 

  처리제곱합을 자유도로 나눈 처리제곱평균은 두 가지, 오차제곱합을 자유도로 나눈 오차제곱평균은 한 가지입니다. 오차제곱합은 자유도가 조금 특이합니다. 각 인자 가짓수에서 1을 뺀 값의 곱이죠. 첨가제는 세 가지 온도는 두 가지니까 오차제곱합의 자유도는 (3-1)(2-1)= 2네요.



 

  처리제곱평균이 둘이니 처리제곱평균을 오차제곱평균으로 나눈 F비도 두 가지입니다. 귀무가설/대립가설 쌍도 두 가지고요.


  여러분은 원하는 인자를 골라서, 각 자유도에 맞는 F분포를 그린 뒤 F비 오른쪽 넓이(p)를 구한 후 유의수준과 비교하면 됩니다. F분포에 들어가는 자유도는 SSTR 자유도와 SSE 자유도로 일원배치법과 같습니다. p값이 유의수준보다 작으면 귀무가설은 기각되고, 그 인자별 모집단 평균은 다르다고 말할 수 있습니다.

 

 

반복이 있는 이원배치법

 

첨가제와 온도가 만나서 시너지를 낼 수도 있잖아요!’


  맞습니다. 첨가제 그 자체, 온도 그 자체가 내는 효과도 있겠지만 특정 첨가제와 온도가 만나서 내는 효과도 있을 수 있습니다. 어느 한 처리가 특별한 값인 건 첨가제나 온도 탓일 수도 있지만, 딱 그 첨가제와 딱 그 온도가 만나서 나오는 효과 탓일 수도 있죠.

 

  반복이 있는 이원배치법은 이렇게 두 인자가 만나서 내는 교호작용(Interaction)’을 확인할 수 있습니다. 반복이 있는 이원배치법은 말 그대로 이원배치법을 처리마다 여러 번 시험하는 것입니다. 첨가제A80도를 세 번 시험하고 첨가제A90도를 세 번 시험하고.



 

  이번 경우에는 처리마다 세 번 시헙했습니다. 이제 자료값과 총평균의 차이는 인자마다 있는 차이뿐 아니라 인자들이 만나서 생기는 차이도 한몫합니다.

 

   자료값과 총평균의 차이

= 첨가제가 달라서 생기는 차이 + 온도가 달라서 생기는 차이

+ 첨가제와 온도가 만드는 차이 + 자료마다 개별로 생기는 차이

 

  총제곱합 = 처리제곱합 세 가지와 오차제곱합



  세 가지 처리제곱평균이 생깁니다. 자연스레 F비도 세 가지고 귀무가설/대립가설도 세 가지가 나오겠죠.




 

 

엑셀 반복이 없는 이원배치법



 

[데이터] - [데이터 분석] - [분산 분석: 반복 없는 이원 배치법]을 선택합니다.

 



데이터 범위과 유의수준을 정합니다.

(‘이름표에 체크하면 인자 이름이 있는 셀도 선택할 수 있습니다.

인자 이름이 결과표에 떠서 결과를 알아보기 쉬우니 체크하는 편이 좋습니다.)

 


 

확인을 누르면 F비와 p값을 볼 수 있습니다.

(변동의 요인에서 인자 A()은 세로(여기서는 온도), 인자 B()은 가로(여기서는 첨가제)입니다.)

 


엑셀 반복이 있는 이원배치법




[데이터] - [데이터 분석] - [분산 분석: 반복 있는 이원 배치법]을 선택합니다.



 

데이터 범위, 표본당 행수, 유의수준을 정합니다.

(엑셀에서 반복 있는 이원배치법을 하려면 처리 별 자료를 세로로 나열해야 합니다. 이 행 수를 표본당 행수로 입력합니다. 가로로 쓴 데이터도 쓸 수 있으면 좋을 텐데요.)



 

확인을 누르면 각 인자와 교호작용에 따른 F비와 p값을 볼 수 있습니다.

반응형
  Comments,     Trackbacks
엑셀로 통계하기 17 - 분산분석(1)
반응형




시작하기 전에



  이제 여러분은 표본평균을 바탕으로 두 모집단의 평균을 비교할 수 있습니다. 그런데 모집단이 여럿이면 어떡하죠?

 


시작!

 

  지난 시간엔 평균을 비교했습니다. 두 표본집단 자료로 두 모집단의 평균이 같은지 다른지를 귀무가설과 대립가설을 세워 대조했습니다.

 

  그런데 모집단이 여럿이라면 어떡할까요? 이전에 배운 평균비교는 두 모집단만 비교할 수 있습니다. ‘모집단 1의 평균=모집단 2의 평균, 모집단 2의 평균=모집단 3의 평균.’처럼 귀무가설을 여러 가지 세워서 동시에 만족하나 살피려면 너무 복잡하고 번거롭습니다.

 

  분산분석(ANOVA, ANalysis Of VAriance)은 여러 모집단의 모평균이 같은지를 한 번에 비교할 수 있는 기술입니다. 영국의 학자 로날드 피셔가 개발한 분산분석은 여러 제약조건이 있기는 하지만 여러 모집단 평균을 동시에 비교할 수 있는 강력한 기술입니다.

 


분산분석 조건


  분산분석을 시작하기에 앞서, 분산분석에 필요한 가정 세 가지를 알아봅시다.

 

첫째, 모집단은 전부 정규분포를 따른다.

둘째, 모집단의 분산은 전부 같다.

셋째, 표본은 무작위로 추출하고 모집단마다 표본은 독립적이다.

 

  첫째 조건이야 표본 크기가 크면 어떻게든 무마한다고 칩시다. 셋째 조건도 지키기 쉽습니다. 둘째 조건은 조금 까다로운데, 여러 모집단의 분산이 전부 같아야 하기 때문입니다. 여러분이 공정을 비교해 제일 빠른 공정을 찾고 싶은 공장장이라면, 공정을 제외한 요소들은 전부 같게 맞춰서 모집단마다 분산이 같도록 애써야 할 것입니다.

 


분산분석 용어




  여러분은 제일 빠른 공정을 찾고 싶은 공장장입니다. 여러분은 온도와 첨가제를 달리하면서 제일 빠른 공정을 찾아낼 겁니다. 온도는 100도와 200도로 조절하고 첨가제는 A, B, C 세 종류가 있습니다. 그럼 온도 두 가지와 첨가제 세 가지로 여섯 가지 조합이 나옵니다.

 

  여기서 온도와 첨가제는 인자Factor이며 인자는 분산분석에서 제어 가능한 독립변수입니다. 100, 200도 같은 선택지는 수준Level입니다. ‘100도와 첨가제 A’, ‘200도와 첨가제 B’같은 조합은 처리Treatment라고 부릅니다. 이렇게 여러 처리에 따른 공정 시간은 반응 변수Response Variable이라고 부릅니다.

 

공장장인 여러분에게

  인자는 온도와 첨가제가

  온도엔 두 가지 수준, 첨가제엔 세 가지 수준이

  이번 분산분석에는 여섯 가지 처리가 있으며

  공정에 걸리는 시간이 반응변수입니다.

 

 

분산분석을 시작하자





 

  지금은 첨가제 A, B, C만 생각합시다. 세 첨가제를 넣어 각각 다섯 번 측정했습니다. 15가지 자료가 있겠네요. 세 표본을 보고 세 모집단 평균이 같은지 다른지 알아보고 싶습니다. 먼저 세 모집단 평균이 전부 같다는 귀무가설을 세워 보죠.




 

  아무 값이나 골라 봅시다. 이 값은 모집단 평균과 다를 겁니다. 왜 다를까요? 두 가지 이유를 생각할 수 있습니다.

 

첫째, 이 값이 속한 처리(첨가제 B) 때문에.

둘째, 같은 처리 속에서도 값이 조금씩 다르므로.

 

  즉 이 값과 모집단 평균의 차는 첨가제가 달라서 오는 차이와 그냥 이 값 자체가 달라서 오는 차이로 나눌 수 있습니다. 첨가제가 달라서 오는 차이는 첨가제마다 있는 표본평균과 총평균의 차이로 표현합시다. 이 값 자체가 달라서 오는 차이는 자료값과 표본평균의 차이로 표현합시다. 모집단 평균은 일단 15가지 자료의 총평균으로 추측하고요. 이 내용을 수학적으로 근사하게 쓰면 다음과 같을 겁니다.



 

이제 이걸 제곱해서 모든 값에 합합니다.



 

(자료와 평균의 차이는 합하면 0이라서 마지막 항은 사라집니다.)

 




  자료와 총평균 차이의 제곱합은 총제곱합(Total Sum of Squares, TTS/SST), 표본평균과 총평균 차이의 제곱합은 처리제곱합(Sum of Squares for TReatments, SSTR), 자료값과 표본평균 차이의 제곱합은 오차제곱합(Error Sum of Squares, ESS/SSE)이라고 부릅니다.






  처리제곱합의 자유도는 표본집단 수 1, 오차제곱합의 자유도는 총 자료 수 –표본집단 수입니다. 갑자기 웬 자유도냐 싶겠지만 분산분석을 하려면 필요합니다. 이번 경우에는 처리제곱합의 자유도는 3(첨가제 가짓수)-1=2, 오차제곱합의 자유도는 15(총 자료 수)-3=12입니다.


 


  처리제곱합을 자유도로 나누고 오차제곱합도 자유도로 나눕니다. 이 값은 각각 처리제곱평균(TReatment Mean Square, MSTR), 오차제곱평균(Error Mean Square, MSE)라고 합니다. 자유도는 좀 있다 또 필요합니다.

 




 

거의 다 왔다. 힘내자!

 

  분산분석을 끝마치려면 F분포가 필요합니다. 그냥 그런 분포가 있다고 알면 됩니다. F분포는 자유도에 따라 모양이 다릅니다. 스튜던트 t 분포랑 비슷하죠. F분포는 그런데 자유도가 둘 필요합니다. 맞습니다. 아까 구한 두 자유도를 F분포에 넣어야 합니다.




  그리고 처리제곱평균을 오차제곱평균으로 나눕니다. 이 값은 귀무가설이 틀릴수록 커집니다. 슬슬 감이 오지 않습니까? F분포에서 이 나눈 값보다 큰 영역이 바로 분산분석의 p값입니다. 귀무가설이 틀릴수록 처리제곱평균/오차제곱평균은 커지고, F분포에서 이 값보다 큰 영역은 줄어듭니다. p값이 작아집니다. p값이 유의수준보다 작으면 귀무가설을 기각하는 건 상식이겠죠?

 


엑셀에서 분산분석 하기



 

  엑셀 데이터 분석 메뉴에는 분산분석: 일원 배치법이 있습니다.




  입력 범위, 데이터 방향, 유의수준을 입력하고 확인을 누릅니다.



 

 

그럼 인자가 둘일 땐?


  이번 시간에는 인자가 하나일 때를 놓고 분산분석을 했습니다. 첨가제 하나만 보았죠. 그런데 첨가제뿐 아니라 온도에 따라서도 모집단 평균이 같은지 알고 싶으면 어떻게 할까요? 지금까지는 인자가 하나인 일원 배치법 One way factorial design’을 배웠다면, 다음 시간에는 인자가 둘인 이원 배치법 Two way factorial design’ 분산분석을 알아봅시다.

반응형
  Comments,     Trackbacks