설찬범의 파라다이스
글쓰기와 닥터후, 엑셀, 통계학, 무료프로그램 배우기를 좋아하는 청년백수의 블로그
엑셀 강의 (14)
3화. 엑셀 텍스트 불러오기
반응형




와, 바람!





끝이 없을 것 같은 폭염도 끝났네

물론 햇볕은 아직 짱짱하지만

폭염에 비하면 냉장고나 마찬가지지.



30도가 넘는 날씨만 겪다가

조금 더운 날씨가 되니

오히려 쌀쌀한 걸.





이런 날일수록 감기를 조심해야지.






할머니, 저승도 계절과 날씨가 있나요?






딱히 있지는 않아.

사계절과 날씨는 변화의 일종.

살아있어야 변화도 겪는 법이란다.





그런가요?






뭐, 요즘 죽은 사람들은 심심해서

수영장이랑 스키장을 지어달라고

염라대왕께 요청하는 모양이다만.






'저승에 스포츠시설을 지으면

구급요원은 필요 없을지도...'








그나저나 민수야.

오늘은 아주 쉬운 엑셀 기술을

들고 왔단다.





그게 뭐죠?






바로 불러오기 기능이지.






불러오기는 저도 할 줄 아는데요.






엑셀에서 엑셀 파일은

아무나 불러올 수 있어요.



하지만 메모장 텍스트 파일이라면 어떨까?






텍스트 파일을 엑셀에요?

음, 어디서 들어본 것 같기도 하고.






예를 들어 실험실에서 자료를 입력해야 하는데

그곳 컴퓨터에 엑셀이 없다고 가정해 보자.



시간은 촉박해서 설치할 시간은 없어.

그럴 땐 메모장에 자료를 적고

나중에 엑셀로 불러와야겠지.





일리가 있네요.

근데 메모장에는 셀이 없는데요.

엑셀은 이걸 어떻게 구분하죠?






크게 세 방법이 있지.


첫째는 띄어쓰기.

둘째는 쉼표.

셋째는 탭(tab)키란다.







어? 전 이런 걸 상상했어요.



칸마다 위치를 같게 맞추면

인식이 쉬울 줄 알았는데...





물론 그 방법도 된다.

그걸 넷째로 하자꾸나.




파일 - 열기를 누르고

파일 형식을 '텍스트 파일'로 정하면

텍스트를 불러올 수 있단다.


* 가능한 확장자는

txt, prn, csv입니다.





* 데이터 - 외부 데이터 가져오기도

기능은 똑같습니다.





텍스트 파일을 선택하면

텍스트 마법사가 나타나는데

세 단계를 거쳐야 한다.






마법사... 세 단계를 거쳐야...



판타지 소설 같네요.







첫 단계는 분리를 선택하는 거다.




쉼표, 탭, 띄어쓰기로 구분하면

'구분 기호'를,

아까 너처럼 똑같은 위치에 놔뒀으면

'너비가 일정함'을 고르렴






2단계는 구분 기호를 고르는 거란다.

정확히 무엇으로 구분했는지 선택하렴.




밑에 구분 미리보기가 나오니까

보면서 고를 수 있단다.





1단계에서 '너비가 일정함'을 골랐으면요?





그럼 2단계에서 구분선 위치를 정한단다.

웬만하면 엑셀이 잘 정하지만,

잘못되었으면 바로잡으렴





마지막 3단계는 데이터 서식을 정한단다.

텍스트가 숫자인지 문자인지 날짜인지...

나중에 정해도 되겠지만

지금 정해두면 편리하겠지.






이 모든 과정을 끝내면

자료가 새 엑셀파일로 나타난단다.





* 데이터 - 외부 데이터 가져오기를 쓰면

3단계 이후 불러올 위치를 고를 수 있습니다.






좋아요, 할머니.

이번에도 엑셀 지식이 확 늘었어요!

반응형

'엑셀 > 엑셀 할머니 시즌 2' 카테고리의 다른 글

2화. 그림으로 그래프 그리기  (0) 2018.08.01
1화. 엑셀 별점 만들기  (0) 2018.07.04
  Comments,     Trackbacks
2화. 그림으로 그래프 그리기
반응형





아.. 덥다.

겨울엔 추워서 고생, 여름엔 더워서 고생.

단군이 터를 잘못 잡아도 한참 잘못 잡았네.

홍익인간이 설마 더워서 벌게진 사람인가?





컴퓨터 방은 들어가기도 싫다.

발열이 왜 이리 심한 거야?

한증막이 따로 없다니까...





으악! 할머니!

여기서 뭐 하세요?





심심해서 왔지.





그러고 보니 할머니.

영혼은 어디든 갈 수 있지 않나요?





원하는 곳은 아무데나 갈 수 있지.





그럼 외국도 가 보셨나요?





물론이지.

일본, 베트남, 호주, 러시아...





여행도 여행이지만

산 사람이 못 가는 곳도 가 보셨어요?

세계적인 미스터리를 풀 수 있을 텐데요.





버뮤다 삼각지대, 체르노빌.

백악관 지하에 정말 비밀기지가 있는지

남미 어딘가에 있는 마야 도시를 찾고..





아! 혹시 우주도 갈 수 있나요?

화성에 생명체를 찾으면 참 좋을 텐데...





...너한텐 이 할미가 수색대원으로 보이는구나.





쓸데없는 호기심은 그냥 접고

엑셀 비법이나 하나 배우렴.





오늘은 뭔가요?





엑셀 막대그래프(차트)를 보면

막대 색을 정할 수 있지?





네, 처음 만들면 늘 파란색이죠.









이걸 그림으로 대신 만들고 싶지 않니?

이렇게 말이다.






오. 그래프 축이 하트모양이 됐어요.

멋진걸요.





만드는 방법을 바로 알려주마

우선 넣을 그림이 필요하겠지?





여기 하트 그림 있어요.





좋다. 그래프를 하나 만들어라.





여기요.








축을 한 번 누르면

모든 축이 전부 선택된다.





오른쪽 마우스를 클릭해

'데이터 계열 서식'을 누르면

오른쪽에 서식메뉴가 나타나지.





왼쪽 '채우기 및 선'을 눌러

채우기 - 그림 또는 질감 채우기를 누르렴





'다음에서 그림 삽입' 밑에 있는

'파일'을 눌러 불러오고 싶은 그림을 불러오면 된단다.





어? 그림이 세로로 늘어났는데요?





밑에서 '늘이기' 대신 '쌓기'를 누르면

우리가 원하는 그래프가 나온단다.






음. 쉽네요.

그래프 축이 그림이면 확실히 보는 재미가 있겠죠?



반응형

'엑셀 > 엑셀 할머니 시즌 2' 카테고리의 다른 글

3화. 엑셀 텍스트 불러오기  (0) 2018.08.17
1화. 엑셀 별점 만들기  (0) 2018.07.04
  Comments,     Trackbacks
엑셀 할머니 시즌 1
반응형

  어떻게 하면 엑셀을 쉽게 설명할 수 있을까 고민했습니다. 떠오른 해답은 '대화체'였죠. 교과서처럼 늘어놓기보다는 한 사람이 설명하고 다른 사람이 질문하며 이해하는 식이 좋다고 생각했습니다. 엑셀 할머니는 그런 아이디어로 태어났습니다.


  왜 돌아가신 증조할머니를 떠올렸는지는 모르겠습니다. 약간의 블랙 코미디라고 보시면 될 것 같습니다. 엑셀이 뭔지도 모르고 살다 간 사람이 현재 젊은 사람보다 엑셀을 더 많이 안다? 거기에 저승에 있는 사람이라면 이런저런 이야기를 꺼내기 좋을 겁니다.


  좋은 글도 있고, 나쁜 글도 있습니다. 조금씩 고쳐나갈 생각입니다.




1화 - 상대참조와 절대참조

2화 - 평균내기

3화 - 가중평균

4화 - 기하평균과 평균성장률(+조화평균)

5화 - 최빈값과 중앙값

6화 - 반올림, 배수로 반올림

7화 - 행과 열 바꾸기

8화 - 분산과 표준편차

9화 - 요일 표시하기

10화 - PDF파일을 엑셀로 변환하기

11화 - 체크박스 만들기

12화 - 드롭다운 단추(목록만들기)

13화 - 엑셀 부가세를 구해보자

14화 - 엑셀 고급필터

15화 - 엑셀 FREQUENCY 함수

16화 - 엑셀암호 걸기

17화 - OFFSET 함수와 응용

18화 - 엑셀 FIND함수와 응용

19화 - 엑셀 사진 삽입하기

20화 - 엑셀 ROW와 COLUMN으로 셀 주소 알아내기

21화 - 엑셀 만나이 계산하기

22화 - 엑셀 함수 만들기

23화 - 엑셀 가나다순 정렬

24화 - 엑셀 로그

25화 - 엑셀 목표값 찾기

26화 - 스파크라인이란?

27화 - 엑셀 스파크라인 만들기


외전 1화 - WEEKDAY 함수(+CHOOSE)

외전 2화 - 엑셀 할인율

외전 3화 - 엑셀 vlookup 함수(+index, match)

외전 4화 - 엑셀 CONCATENATE 함수


반응형
  Comments,     Trackbacks
엑셀 VBA 레시피 - 시작하기
반응형






  안녕하세요. 나는 Gustave Alvarado다. 프랑스 식당 주인이다. 사람들 물어본다 왜 내 성씨 스페인인가. 내 할아버지는 마드리드에서 왔다. 그는 요리 매우 잘 했다. 할머니 그가 프랑스에서 만난 채식주의자였다. 할아버지가 그녀를 고기 먹게 만들었다 뛰어난 요리 실력으로. 나도 그처럼 되고 싶다.





  사람들은 나한테 요리 어떻게 하는지 물어본다. 난 서점 가서 사라고 말한다. 음식을 만드는 것 그리고 요리하는 법 가르치기 다르다. 너들은 기초에서 배워야 한다. F1 운전자 찾아가서 물어보지 말아라 면허 얻기 전에. 다행히 나는 엑셀 잘하지 않는다 내 요리하는 만큼. 그런 이유로 여러분을 가르침이 가능하다. 지금 우리는 동업자다 그러므로 불러라 나를 Gustave라고.






  나는 조금 한국인 여기서 만난다. 한국 관광객들은 항상 말한다 취업하기가 어렵다. 지난번에 만난 소녀 대학에서 철학 수강해 왔다. 교양으로 풍부한 여자 그러나 직업 얻지 못했다. 그녀는 표정을 찌그러뜨렸다 말하며 "마이크로스프트 엑셀 배운 사람이 나보다 사회에 더 쓸모있다." 나는 그녀 불쌍히 생각한다. 하지만 철학은 똑똑한 것인데 어떻게 그녀는 예상하지 못했는가 철학이 직업을 주지 않는 것?







  진짜 기술은 인생에 중요하다. 여러분은 그걸 배워야 한다. 먹고사는 것 한 가지 실력만으로, 아주 큰 실력 필요하다. 당신은 세계적이어야 할 것이다. 만약 아니라면 당신은 여러 가지 배워야 한다. 엑셀이 그들 중 한 명이다. 많은 경영자들 내 식당에 방문하는 불평한다 엑셀 배우면 많은 편함 찾을 수 있다.







  당신은 서점에 갈 수 있다 그리고 많은 엑셀책들 찾는다. 초보를 위함, 회사를 위함, 그냥 취미를 위함... 무엇이든 당신이 보는 것, 그들은 각자 주제를 가진다. 그러므로 나도 하나 가진다. 내 테마는 VBA다. 내가 친구에게 물어볼 때, 그들은 손을 저었다. "VBA는 프로그래밍 사람만을 위한다." 그러나 나는 VBA 멋있음을 발견했다. 요리와 달리, 괜찮다 엑셀 망치는 것. 재료를 낭비하지 않는다. 누가 식중독 발병하지 않는다(네가 아니 회사에서 보고서 쓸 때).






  학습은 재밌다. 학습은 살기 위한 힘을 준다. 음식은 시간이 갈수록 부패한다, 그러나 지식은 반대로 숙성한다 마치 와인처럼. 그래서 배워보자 같이. 엑셀 미공부의 결과물들아.








  VBA는 Visual Basic for Application를 위해 선다. Visual Basic은 컴퓨터를 위한 말이다. 당신이 영화 볼 때 매트릭스처럼, 많은 0과 1이 보인다. 그것이 어떻게 컴퓨터가 일하는지다. 그러나 0과 1만 쓰는 것 너무 복잡하다. 여러 컴퓨터 전문가들이 컴퓨터 언어 만들었다. 그걸 사용함, 더 편하게 일한다. Visual Basic이 그중 하나다. Application은 쉽다. 휴대폰을 집어라. 당신은 휴대폰에 있는 프로그램을 본다. 요즘 아이들은 그걸 부른다 App이라고. 안전하다 Application을 App이라고 보는 것.






  우리는 Excel을 공부하기 때문, Application은 Excel을 의미한다. 그래서 VBA는 Excel을 위한 컴퓨터 말이다. 무슨 뜻인가?






  당신은 식당에 가서 메뉴를 든다. 하나를 고른다. 시킨다. 종종 추가 주문한다. '덜 익힘 원한다.' '양파를 더 넣어라.'. 내 식당에 만족하지 않으면(난 노력한다 이것이 불가능하다) 당신은 요리를 배우고 직접 요리한다. 메뉴에 없는 밥을 만든다.






  Excel 거대한 기능 가진다. 함수들, 그래프들... 그러나 가끔 당신은 못마땅하다 Excel 것들. 그것이 시작이다 당신이 VBA를 작동하는. VBA는 자유로운 Excel이다. 함수를 만들어라, 기능 사용해라 제공하지 않는. 버튼을 누르고 셀을 정렬한다? 새 창을 띄워 자료를 넣어라? 가능하다 VBA 안에서는!






  아무튼 나는 Excel 2016년과 일한다. 단축키는 Alt + F11이다. 화면 위에 개발 도구 누르고 왼쪽에 있는 Visual Basic 클릭도 가능하다. 만약 개발 도구 없으면 파일 - 옵션 - 리본 사용자 지정 들어가라. 개발 도구 네모에 체크하고 확인 누른다.






  VBA에 들어가면 많은 메뉴 있다. 놀라지 말아야 한다. 우리는 조금만 건드릴 것이다. 삽입 - 모듈을 누른다. 흰 화면이 생긴다. 당신은 여기에 글씨를 쓸 수 있다. 물론, 알맞은 단어를 넣어야 한다. 컴퓨터 나라에 온다면, 컴퓨터 말 써라!


  다음 시간에 나는 조금 기초적인 VBA 해볼 것이다. 좋은 운!

반응형
  Comments,     Trackbacks
1화. 엑셀 별점 만들기
반응형





. 방학이다.

날은 더워지고, 몸에 힘은 빠지고.

 


그러고 보니 엑셀 활용법을 가르쳐 주시던

증조할머니도 안 오시네.

많이 바쁘신가?

 


노느라 바쁘다. 노느라.



 

깜짝이야!

할머니! 어디 계셨어요!

 


당연히 저승에 있었지.

더워서 나도 쉬다가 왔다.

 


저승에서도 휴가를 가나요?

(아니, 죽어도 더위를 느끼나?)

 


그럼 종일 뭐 하니?

귀신은 잠도 안 자는데.


 

어디로 가나요?




 


남들 가는 대로 가지.

산과 바다와 별장으로.

이승 사람들 마주치기 싫어서

조용하고 외딴곳이 인기란다.

 


(그래서 폐가와 폐건물에

귀신 목격담이 많은 걸지도.)


 

아직도 엑셀이 고민이니?


 

아뇨. 방학인걸요.

올해는 휴학하면서 이것저것 경험하려고요.




좋다.

안 그래도 엑셀공부를

조금 달리할 생각이었다.


 

달리한다니 어떻게요?



 

복잡한 기능보다는

멋있고 재밌는 기능 위주로

가르치고 싶었다.

 


엑셀이 멋있으면 얼마나 멋있다고요.

 


예끼! 요즘은 멋있어야 사는 시대야.

할머니 어렸을 때는 가난해서

일만 해내면 쓸만한 사람이라 했어요.



 

일은 잘하는 게 맞죠.

 


세상은 다투어서 이기는 곳.

남보다 잘하지 못하면

아무리 잘해도 진 것과 다름없어.

 


(으으)좋아요.

오늘은 뭘 배우죠?

 


민수는 별점이라고 들어 봤지?

 


별점이요?

영화잡지 같은 곳에서

영화에 점수를 매길 때 쓰는 방식 아닌가요?


 


주로 별 넷이나 다섯을 만점으로

영화 등급을 매기죠.

 


그래.

미슐랭 가이드는 식당을 별 셋 만점으로 표현하지.

 


영화와 레스토랑에 쓰는 별점이

엑셀과 무슨 상관이죠?

 


오늘은 말이다.

엑셀을 써서

점수를 별점으로 바꾸는 방법을

알아보자꾸나.

 


점수를 별점으로 바꾸기



 

별은 모두 열 개,

점수만큼 검은 별

나머지는 하얀 별을 넣자.

 


10점은 별 하나.

20점은 별 둘.

이렇게요?

 


그래.

1의 자리는 버리자꾸나.

예를 들어,

55점은 별 다섯을 쓰는 거다.

 


10의 자리만 보자는 건데.

점수를 10으로 나누고

소수를 버리기만 한다면.

 




엑셀에는

QUOTIENT 함수가 있단다.


QUOTIENT

나눗셈 몫의 정수부분만 반환하는 함수

=QUOTIENT(숫자, 나눌 수)


EX> QUOTIENT(17, 4) → 4

(17÷4 = 4.25이므로)

 


10으로 나눠 정수만 남길 수 있겠네요.

555,

797이 되겠죠.

 


좋아.

그럼 그 수만큼 별을 써야겠지?



 


문자를 바라는 대로

쓰는 함수는 없나요?

 


REPT함수가 그 주인공이다.


REPT

문자는 횟수만큼 반복해 쓰는 함수

=REPT(문자, 횟수)


EX> REPT("가", 5) → 가가가가가

 


좋아요.

검은 별은 아까 구한 수대로 쓰고

흰 별은 10에서 그 수를 빼서 쓰면 되겠죠?




 

두 문자열을 붙이는 함수는

CONCATENATE란다.


CONCATENATE

여러 문자열을 합치는 함수

=CONCATENATE(문자열, 문자열 …)


EX> =CONCATENATE("토","마","토") → 토마토

 


좋아요. 완성했어요!

 




=CONCATENATE(REPT("", QUOTIENT(셀 주소,10)), REPT("", 10-QUOTIENT(셀 주소,10)))

 

참고. 별표는 ‘ㅁ’을 누르고 한자를 눌러서 불러옵니다.

 




완벽하네요!

 

 

 

별 다섯이 만점인 별점은

10 대신 20으로 나누고

흰 별은 5에서 빼면 되겠지.

반응형

'엑셀 > 엑셀 할머니 시즌 2' 카테고리의 다른 글

3화. 엑셀 텍스트 불러오기  (0) 2018.08.17
2화. 그림으로 그래프 그리기  (0) 2018.08.01
  Comments,     Trackbacks
하루 30분) 엑셀 조건부 서식
반응형



  수많은 자료 중에서 원하는 자료만 색을 바꾸거나 굵은 글씨로 만들 수 있다면 얼마나 좋을까요. 한눈에 들어와서 보기도 좋고 쓰기도 좋을 겁니다. 엑셀 조건부 서식은 실용성도 좋지만 컴활 자격증 시험에서 물어보기도 하니 꼭 알아둬야 하겠죠.

 

  엑셀은 이미 여러 조건부 서식을 지원합니다. ~보다 높은 숫자나 상위 몇 퍼센트를 강조하는 식이죠. 기본 내용은 예전 포스트에서도 설명했으니 이번엔 수식을 직접 입력해서 조건부 서식 고수가 되어 봅시다.

 


시작하기 전에 예제 파일 받아가세요!


조건부서식-엑셀카페.xlsx




우리만의 약속


첫째. 예제 파일로 한 번씩 예제 연습하기

둘째. 아리송하면 복습하기

셋째. 부담 없이 잔잔히 즐기기



* 이 포스팅은 엑셀2016을 기반으로 썼습니다.

* 밑 조건식을 그대로 붙여넣기 하면 작동하지 않았습니다. 까닭은 모르지만 참고만 하시고 손수 쓰시기 바랍니다.

 



범위 정하기



  조건부 서식 규칙을 만들기 전에 조건을 적용할 셀들을 지정합니다.

드래그로 범위를 정합니다.

 



주의. 제목 셀은 범위에 넣지 않습니다!

 


조건부 서식 시작하기




  범위를 정하고 홈 리본에 있는 [조건부 서식]을 클릭합니다.

[새 규칙]을 누르고 수식을 사용하여 서식을 적용할 셀 결정을 누릅니다.




  밑에 입력창이 하나 생깁니다. 이곳에 규칙을 입력합니다.


  '서식'에서는 규칙에 맞는 셀에 어떤 서식을 줄지 정합니다. 이번 포스트에서는 전부 하늘색으로 셀을 칠하겠습니다.



 

 



예제 1) 나이가 50세 이상인 사람의 행을 칠할 것



=($D3>=50)





주의. 규칙을 입력할 때 방향키를 누르면 셀 주소가 나타납니다. 입력 커서는 마우스로만 움직입시다!

 

 




예제 2) 남자인 행만 칠할 것



=($C3="남자")



 

참고. C열이 남자가 아닌 행은 조건식이 뭘까요? <>를 씁니다.


=($C3<>"남자")

 


 

예제 3) 회원번호 첫 글자가 A인 사람의 행을 칠할 것



엑셀 LEFT 함수는 셀 텍스트를 왼쪽부터 추출하는 함수입니다.

(LEFT 함수의 첫 인수는 셀 주소둘째 인수는 추출할 글자 수입니다)

 

=(LEFT($F3,1)="a")





참고. 셀 텍스트를 오른쪽부터 추출하는 함수는 뭘까요?

, 맞습니다. RIGHT 함수입니다.

 

 

예제 4) 회원번호 두 번째 글자가 5 이상인 행을 칠할 것



  셀 텍스트를 중간부터 추출하는 함수는 MID입니다.


MID(셀 주소, 추출을 시작할 글자, 추출할 글자 수)

(이 경우에는 셀 주소, 2, 1이겠죠)

 

=(MID($F3, 2, 1)*1>=5)



 

잠깐! ‘*1’이 있죠?

  LEFT, MID RIGHT 함수는 셀 글자를 텍스트로 추출하는 함수입니다. 아무리 숫자를 빼냈어도 텍스트 상태기 때문에 다른 숫자와 비교할 수가 없습니다. 따라서 *1을 해서 숫자로 바꿔야 제대로 서식이 적용됩니다.

 

 

예제 6) 행 번호가 짝수/홀수인 행을 칠할 것



행 번호를 반환하는 함수는 ROW입니다.

ISEVEN 함수는 인수가 짝수면 TRUE를 반환하고

ISODD 함수는 인수가 홀수면 TRUE를 반환합니다.

 

행 번호가 짝수인 행을 칠할 땐

=ISEVEN(ROW())

행 번호가 홀수인 행을 칠할 땐

=ISODD(ROW())



 

참고. 열 번호를 반환하는 함수는 COLUMN입니다.

 

 

예제 7) 행 번호가 3의 배수인 행을 칠할 것



MOD 는 나눗셈 후 나머지를 구하는 함수입니다.

3으로 나누어 나머지가 0이면 3의 배수겠죠?

 

=MOD(ROW(), 3)=0



 




예제 8) 등록일이 8월인 행을 칠할 것



  날짜에서 달수를 추출하는 함수는 MONTH입니다.

 

=MONTH($E3)=8



 

예제 9) 등록 날짜가 15일 이상인 행을 칠할 것



날짜에서 날짜를 추출하는 함수는 DAY입니다.

 

=DAY($E3)>=15



 

 

예제 10) 점수가 상위 10등인 행을 칠할 것



LARGE 함수는 범위에서 ~등인 값을 반환합니다. 이 함수를 응용합시다.

 

=$G3>=LARGE($G$3:$G$22,10)

해석 : 점수 범위에서 10등인 값 이상인 점수 행을 색칠





예제 11) 점수가 평균보다 높은 행을 칠할 것



평균을 구하는 함수는 AVERAGE입니다.

 

=$G3>AVERAGE($G$3:$G$22)



 


예제 12) 여자면서 나이가 40세 이상인 행을 칠할 것



이제 조건이 두 가지입니다.

두 조건을 만족하는 조건부 서식을 쓰는 법은 둘입니다.

 

첫째, AND 함수 이용

둘째, * 이용

 

=AND($C3="여자", $D3>=40)

=($C3="여자")*($D3>=40)



 

참고. AND 함수는 두 조건이 모두 맞을 때만 TRUE를 반환합니다.

 

참고. *AND처럼 TRUE*TRUE일 때만 TRUE를 반환합니다.

반응형

'엑셀 > 하루 30분 엑셀카페' 카테고리의 다른 글

하루 30분) 엑셀 고급필터  (0) 2018.07.03
  Comments,     Trackbacks
엑셀로 통계하기 6 - 공분산과 상관계수
반응형





1학년 1반의 국어, 수학 성적입니다.

국어성적이 높으면 수학성적도 높을까요?



 

공분산, Covariance는 두 변수의 직선관계를 측정합니다.

 


각 변수의 편차곱 합을 자료크기로 나눈 값이죠.

 



공분산의 절댓값이 클수록

두 변수는 직선관계가 강합니다.

 



문제는 두 변수의 단위가 다를 수 있다는 점이죠.

국어, 수학 성적은 둘 다 단위가 이지만

 



예를 들어 키와 몸무게라면 어떨까요?

cmkg를 곱한 혼종이 공분산의 단위겠죠.




게다가 다른 자료는 mlb(파운드)라면요?

두 자료는 단위가 다르니 비교할 수 없죠.

 



지난 시간

표준 편차를 평균으로 나눠 무단위인 상관계수를 구했습니다.

이번에도 비슷합니다.



 

상관계수Correlation Coefficient, 그중

피어슨의 상관계수는 공분산을 두 변수의 표준편차 곱으로 나눈 값입니다.

 



상관계수가 1이면 두 변수는 완벽한 양의 직선관계입니다.

상관계수가 1이면 완벽한 음의 직선관계입니다.


 


엑셀 공분산 함수는

COVARIANCE.P(모집단)/COVARIANCE.S(표본),

CORREL 함수로 상관계수를 구합니다.

 



그러나 여기서 주의!

상관관계는 인과관계가 아닙니다.

상관관계가 크다고 한쪽이 어느 한쪽을 유발한다는 법은 없습니다.

두 변수는 우연히 상관관계일 수도 있고

둘을 조절하는 공통원인이 상관관계를 만들 수도 있습니다.

반응형
  Comments,     Trackbacks
엑셀로 통계하기 2 - 상자 수염 그림
반응형






이런 그래프. 어디선가 보셨을 겁니다.

 




이건 상자 수염 그림Box-and-whisker Plot,

일명 상자그림Box Plot입니다.

보시다시피 상자에 수염처럼 선이 위아래로 나 있군요.

 



상자 수염 그림은 데이터 분포를 나타내는 그래프입니다.

값이 어디에 쏠려 있는지, 흩어졌는지 알려주죠.

 



평균만 알면 되는 거 아냐?’

이렇게 생각하신 분 많으시겠죠.



 

이 데이터는 10명의 수치를 나타냅니다.

그런데 평균이 좀 이상하군요.

 




바로 수치가 아주 큰 김길동 씨 덕분입니다.

김길동 씨 때문에 10명이 고루 저만큼 가진 것처럼 보이네요.



 

이처럼 평균은 극단적인 값이 있으면

갈대처럼 요동쳐서 데이터를 잘 대표하지 못합니다.

 



상자 수염 그림은 어떻게 그릴까요?

상자 수염 그림엔 평균이 들어가지 않습니다.

차근차근 알아봅시다.

 



일단 최솟값과 최댓값이 필요합니다.

이건 쉽군요.

 



그리고 1, 2, 3사분위가 필요합니다.

이게 뭐냐고요?

 


간단히 말해 1사분위는 100명 중 75등 수치,

2사분위는 100명 중 50등 수치, 3사분위는 100명 중 25등 수치입니다.

 



이제 다섯 가지 수치를 알았으니

상자 수염 그림을 그려봅시다.

 


상자 수염 그림 속 직사각형이 있습니다.

직사각형 아랫변은 1사분위, 윗변은 3사분위입니다.

 



직사각형 안에 2사분위를 그읍시다.



 

사분위수 범위, IQR을 구합니다.

IQR은 3사분위 1사분위입니다.

 



3사분위보다 1.5IQR만큼 큰 수치를 구합시다.

그 수치보다 낮은 값 중 제일 큰 값에 선을 긋습니다.

 



1사분위보다 1.5IQR만큼 작은 수치를 구합시다.

그 수치보다 큰 값 중 제일 낮은 값에 선을 긋습니다.

 

두 선은 직사각형과 연결합니다.

 



제일 높은 선과 제일 낮은 선에도 끼지 못한 데이터들은

따로 점을 찍습니다.

‘1.5IQR이나 여유를 주었는데 거기에도 끼지 못하다니!’

이상치로 생각하는 것이죠.

(원하면 평균을 표시해도 좋습니다.)

 (아니면 그냥 최솟값과 최댓값까지 수염

그릴 수도 있습니다.)



 

엑셀로 상자 수염 그림 그리기

 

엑셀로 상자 수염을 그릴 수 있습니다.

(2016부터)



 

[삽입] - [차트]에서 히스토그램이 있는 곳을 누르고

[상자 수염 그림]을 선택합니다.

 



*"사분위수 계산에서 중앙값 포함/제외는 뭐죠?"

중앙값 포함을 선택하면 데이터 수가 홀수일 때 중앙값을 계산에 넣습니다. 중앙값 제외를 선택하면 제외고요.

 

*"사분위수를 엑셀로 계산할 수 있나요?"

엑셀엔 사분위수를 계산하는 함수가 있습니다.

QUARTILE 함수가 있었는데 2016부터는

QUARTILE.EXC 함수와 QUARTILE.INC 함수가 생겼습니다.

두 함수 모두 뒤에 데이터 배열과 구할 사분위수가 들어갑니다.


) QUARTILE.EXC(A1:A100, 1)

A1:A1001사분위수를 구합니다.


QUARTILE.EXCQUARTILE.INC는 거의 같은 함수입니다. 다만 QUALTILE.INC04를 넣을 수 있습니다. 0을 넣으면 최솟값, 4를 넣으면 최댓값을 구합니다.

 

 

*"상자 수염 그림은 완벽한가요?"


당연히 아닙니다. 상자 수염 그림이라고 모든 데이터 분포를 요약해주진 않습니다.

예를 들어 하나는 평범한 분포고 다른 하나는 양쪽으로 흩어진 분포여도 상자 수염 그림은 같게 나옵니다.

반응형
  Comments,     Trackbacks
엑셀로 통계하기 1 - 도수분포표, 히스토그램
반응형






한 명의 죽음은 비극이지만, 백만 명의 죽음은 통계다.’

스탈린이 남긴 말이라고 합니다.

 




숫자가 커질수록 우리는

현실을 수치로 정리합니다.

 



비겁하다고 생각할 수도 있지만,

이렇게라도 이해해야 하지 않겠습니까.

 



수많은 자료를 정리하는 방법 하나는

범위를 정하고 범위에 속하는 자료 수를 구하는 것입니다.

 



, 흔히 이걸 도수분포표Frequency Table라고 부르죠.

도수분포표의 범위는 계급Class라고 하고요.

 




엑셀에서 도수분포표, 히스토그램 만들기

 


도수분포표를 쓰려면 계급을 정하고,

그 계급에 속하는 데이터 수를 알아야 합니다.

 


FREQUENCY 함수를 이용할 수 있지만

저는 [데이터] - [데이터 분석]을 추천합니다.

 



[데이터 분석]이 없다고요?

[파일] - [옵션] - [추가 기능]에 들어갑니다.



 

아래 [이동]을 누르고 [분석 도구]를 선택한 다음

확인을 누릅니다.

 



[데이터 분석]을 누르고 여러 메뉴 중

[히스토그램]을 고릅니다.

기능 이름이 [히스토그램]이지

도수분포표도 만들 수 있습니다.

 



그럼 도수분포표부터 만들어 봅시다.

[입력 범위]에는 데이터 범위를 넣습니다.

 



[계급 구간]을 비우면 엑셀이 자동으로 계산합니다.

[계급 구간]에 자기가 만든 목록을 넣을 수 있습니다.

 

[계급 구간]미만이 아니라 이하로 계산합니다.

10, 20, 30이 있으면

‘10 이하’, ‘10 초과 20 이하’, ‘30 초과입니다.




 

맨 밑 [차트 출력]을 누르면

히스토그램을 만듭니다.

 



엑셀 히스토그램 차트도 있으니

더 멋지고 쉬운 것으로 고르시기 바랍니다.

 




(보너스)

히스토그램 계급 너비 고르기



여기 자료가 있습니다.

히스토그램을 그려 볼까요?



 


이런, 계급 너비가 너무 좁아서 들쑥날쑥하네요.

 



이건 계급 너비가 너무 넓어 값을 분류한 의미가 없습니다.

 



그럼 히스토그램 계급 너비는 어떻게 정할까요?

 



학자들은 자신만의 계급 개수 공식을 만들어왔습니다.

(계급 개수를 알면 계급 너비도 정해지므로 둘은 결국 같습니다.)

 


스털지스 공식Sturges' formula에 따르면

계급 개수는

 입니다. (n30 미만일 때는 부적합)

 

라이스 공식Rice rule에 따르면

계급 개수는

입니다.

 



물론 계급 개수, 너비에 정답은 없습니다.

데이터 분포를 잘 나타내는 값이라면 뭐든 좋겠지요.

반응형
  Comments,     Trackbacks
엑셀 할머니 27 - 엑셀 스파크라인 만들기
반응형





지난 이야기 : 스파크라인이란?




할머니, 스파크라인 만드는 법 좀

알려주세요!





[삽입] - 스파크라인 탭에서

원하는 스파크라인을 선택하렴

1) 꺽은선형

2) 열

3) 승패(양수와 음수)




창이 나타나면

데이터 범위와 위치 범위를 선택하고

확인을 누르렴




그럼 바로 스파크라인이 나타난단다.




음. 두께도 너무 가늘고

색깔도 바꾸고 싶은데...




그럼 스파크라인을 클릭하고

위에 있는 디자인 탭을 누르렴




[데이터 편집]에서는 데이터와 위치를 다시 정하거나, 빈 셀 처리법(생략하거나 0으로 간주)을 고를 수 있다.


[종류]에서는 스파크라인 종류를 바꾼다.


[표시]는 최고점이나 최저점에 점을 찍거나 색을 달리 하도록 선택할 수 있단다.




[스타일]에서는 색과 두께 등을 고를 수 있단다.




[축]에서는 축 옵션을 바꾸고..


스파크라인을 없애고 싶다면 [지우기] - [선택한 스파크라인 지우기]를 누르렴.





엑셀 스파크라인 예제.xlsx


여기 샘플 파일이 있으니

한번 보고 원하는 색과 모양을 비교해보렴.

반응형
  Comments,     Trackbacks