설찬범의 파라다이스
글쓰기와 닥터후, 엑셀, 통계학, 무료프로그램 배우기를 좋아하는 청년백수의 블로그
나무위키, 위키피디아는 왜 구글 상위에 있을까?
반응형

나무위키, 위키피디아의 SEO




  구글에 아무 검색어나 입력해 보세요. 늘 위키가 상단에 나타납니다. 전문 분야 검색어나 생소한 외국어, 아주 구체적이지 않은 검색어는 대부분 나무위키나 위키백과가 구글 최상위 못해도 두세 번째로 나타납니다. 예를 들어 지금 생각난 열 가지 검색어를 검색하면 위키가 몇 번째로 나타나는지 살펴봅시다.


(순위는 나무위키 - 위키백과 순)

지하철 1호선 - 1, 4

안드로이드 - 2, 4

불국사 - 2, 1

상대성 이론 - 4, 1

다다이즘 -2, 1

M1 개런드 - 2, 1

재료역학 - 4, 1

스타크래프트 - 3, 4

RLC 회로 - 4, 1

레드벨벳 - 1, 2


  정말 이 세상 모든 지식은 위키백과와 나무위키에 있는 것만 같습니다. 그 덕분에 나무위키는 국내 사이트 중에서 어마어마한 유입량을 자랑합니다. 순위는 네이버, 구글, 유튜브 등 대형포털과 세계적 사이트 바로 뒤를 잇고 트위터를 뛰어넘습니다.




  왜 구글은 위키를 좋아할까요? 많은 사람, 특히 나무위키를 '꺼라위키'라 부르며 싫어하는 사람들도 알고 싶어하지만 사이트를 구글에 최적화(SEO)하고 싶은 사람들도 궁금해합니다. 비법을 알아낸다면 자기 블로그와 사이트에 적용할 수도 있을 테니까요. 구글이 위키를 좋아하는 이유, 비전문가지만 여러 자료와 기사를 뒤져보고 밝혀 보겠습니다.



1. 분량




  위키백과 영어판 위키피디아는 약 580만이 넘는 페이지를 지니고 있습니다. 한국 위키백과는 45만이 넘죠. 그외에도 일본어, 중국어, 스페인어, 독일어, 러시아어 등을 합치면 모두 5천만을 넘는 페이지가 있습니다.



  어느 애드센스 가이드 책이 말하길, 티스토리 블로그 게시물이 400을 넘으면 조회수가 크게 늘어난다고 합니다. 블로그를 운영하신다면 게시물 400편을 쓰기가 얼마나 힘드신지 아실 겁니다. 그런데  5천만 페이지라니. 구글이든 네이버든 페이지가 많은 페이지를 선호하겠죠. 분량도 만만치 않습니다. 예를 들어 '상대성 이론'을 검색해 나오는 한국물리학회 글은 약 9700자인 반면 나무위키 항목은 약 18000자입니다. 나무위키보다는 한국물리학회 글이 신뢰성은 더 높겠지만 말입니다.


  위키피디아는 원래 백과사전 페이지뿐 아니라 모바일 페이지 등의 서브도메인, 거기에 위키북스나 위키소스 같은 패밀리 사이트를 거느리고 있으니 검색엔진의 사랑을 더 받겠죠.



2. 퀄리티




  예전엔 검색엔진을 악용해 아무렇게나 페이지를 늘렸습니다. 수 년 전만 해도 네이버 웹사이트 검색결과나 구글 검색에 괴상한 페이지가 흔했죠. 주로 소설 본문 중간에 검색 키워드를 넣으면, 검색엔진은 분량도 있겠다 키워드도 있겠다 검색 결과에 올렸습니다. 이 편법은 포털 검색엔진이 발달하면서 걸러지게 되었습니다. 위키는 이런 돌연변이와 다르게 많은 기여자가 진심으로 정보를 주고 싶어 페이지를 작성합니다. 물론 어그로도 사기꾼도 있겠지만, 적어도 사기꾼 하나가 소설 본문을 집어넣진 않습니다.


  위키 글이 정확하고 전문적이라고 말하긴 힘듭니다. 틀린 내용도 많고, 학술 단체에서 검증을 받지도 않았습니다. 운영진이 여러 규칙을 마련하고, 일부 기여자들이 출처 불분명한 구절을 지우거나 신고해도 위키가 신뢰를 얻지 못하는 이유입니다. 그러나 아주 거짓말이 가득한 곳은 아닙니다. 다는 아니지만 대체로 정확하고, 다른 사이트에서 주지 못하는 정보를 줍니다. 어떤 내용은 나무위키만 정보를 주기도 합니다. 애니메이션이나 만화, 게임 정보는 나무위키가 거의 유일하게 정보를 담은 사이트입니다.



3. 외부 링크




  검색엔진은 글 품질을 어떻게 따질까요? 여러 기준이 있지만 링크수가 따지는 법 중 하나입니다. 이 페이지로 가는 링크가 많다면 인기가 높으니 좋은 글일 확률이 높다는 것이죠. 피인용수로 인기도를 따지는 논문과 비슷합니다. 한때 이점을 악용해 위키피디아에 자기 페이지로 가는 링크를 올려두어 페이지 품질을 높이려던 꾀를 부렸지만, 지금은 소용이 없게 되었습니다. 기여자들이 보자마자 삭제하기도 하고, 무엇보다 위키피디아는 nofollow, 즉 위키피디아 밖으로 가는 외부링크를 검색엔진이 못 따라가게 하는 코드를 쓰기 때문입니다.


  위키피디아, 나무위키는 유명합니다. 이 두 사이트 내용을 논문에 넣는 바보 대학원생은 없으리라 믿겠지만, 논문이 아닌 인터넷 세계에선 두 위키 페이지가 곧잘 인용됩니다. 수많은 진입링크를 가진 사이트를 구글이 싫어할 이유가 있을까요?




4. 내부 링크




  '나무위키 하다가 시간 가는 줄 모른다'고 합니다. 주된 원인은 내부 링크입니다. 링크를 타고 타고 가다 보니 어느새 이순신이 BMW가 되고 떡볶이가 되었다는 겁니다. 나무위키를 싫어하는 사람도 이런 링크 중독성은 인정합니다.


  위키 사이트의 이런 내부링크는 사용자를 끝없이 잡아놓습니다. 사이트 체류시간도 검색엔진이 지켜보는 내용 중 하나입니다. 링크를 타고 가다 보면 체류시간이 길어지고, 그럴수록 구글은 '이 사이트에 들어간 사람은 나오질 못하는구나. 얼마나 좋은 사이트길래'라고 생각합니다.


  검색엔진은 바보가 아니라서 페이지에 내부링크를 잔뜩 박아넣는다고 해서 좋게 평가하진 않습니다. 링크는 현재 페이지와 연관이 있어야 하고 너무 많아도 안 되고 또 그렇게 링크를 타고 간 페이지도 풍부하고 좋은 글이 있어야 합니다. 그야말로 위키한테 딱이죠.




  특히 위키계열에는 링크모음이 있습니다. 예를 들어 위키백과 '어니스트 헤밍웨이' 페이지의 최하단에는 '노벨 문학상 수상자'라는 탭이 따로 있습니다. 이런 링크모음은 나무위키에선 최상단에 있는 편입니다. 사이트 모든 페이지에 있는 링크를 흔히 '사이트와이드Site-wide' 링크라 부릅니다. 구글은 이런 사이트와이드는 무시하는데, 이런 링크모음은 사이트와이드로 보지 않아 페이지의 가치를 꽤 높여 줍니다.



5. 사이트 구조




  흔히 개념을 범주로 분류합니다. 소녀시대라면 인물 - 예술가 - 가수 - 한국 가수 - 아이돌 - 걸그룹 - 소녀시대로 분류할 수 있겠죠. 소녀시대까지 가려면 5단계를 지나야 하는 셈입니다.


  위키 소녀시대 페이지에 들어가 URL을 보시기 바랍니다. 위키피디아/인물/예술가/가수... 이던가요? https://ko.wikipedia.org/wiki/소녀시대로 사이트 URL 바로 뒤에 항목이 들어갑니다. 우리가 알던 SEO 내용과는 반대입니다. 흔히 페이지 주소는 옹기종기 분류해서 마치 뿌리처럼 타고 내려가는 방식이어야 검색엔진에 유리하다고 가르칩니다. 그러나 위키는 그런 가르침에 정면으로 반박합니다. 분류 없이 바로 들어가도 괜찮다는 증거죠. 물론 글 내용이 좋아야 이런 '반항'도 가능합니다.



6. 모바일 친화




  네이버 웹마스터도구에는 사이트 기준에 떡하니 모바일 친화성이 있습니다. 구글도 모바일에서 잘 실행되는 사이트를 좋아합니다. 위키백과와 나무위키는 모바일에서도 잘 실행되며, 모바일에서도 보기가 불편하지 않습니다.



7. 팩트를 내놔!




  우리가 화성(Mars)을 검색할 때 알고 싶은 건 뭘까요? 화성이 지닌 낭만이나 감성을 알고 싶진 않을 겁니다. 그보다 화성의 크기와 표면 온도, 공전 주기를 알고 싶겠죠. 그런 점에서 위키백과를 이길 수는 없습니다. 위키백과는 분량도 분량이지만 우리가 알고 싶은 팩트들을 또박또박 나열하고 있습니다. 구체적인 글도 있지만 매 문단을 개략과 주제로 시작합니다. 위키백과 화성의 '지질' 문단은 이렇게 시작합니다.


궤도선의 관측과 화성 기원의 운석에 대한 분석 결과에 의하면,

화성의 표면은 기본적으로 현무암으로 되어 있다.


  이렇게 중심적인 문장 이후, 다른 성분이나 있을 것으로 추측되는 것들, 내부 구조와 지질 시대로 이어집니다.

반응형
  Comments,     Trackbacks