검색엔진 최적화의 기본 : 사이트맵(sitemap)의 중요성


검색엔진에 인덱스 되는것이야 말로 검색엔진 최적화의 궁극적인 목표이며 핵심이라고 볼수있습니다.

하지만 검색엔진 봇들은 사이트 깊숙이 파뭍혀 있는 링크를 찾기 힘들어 합니다.

만약 사이트의 메인페이지로부터 어떤 페이지로 가려고 하는데, 4번 이상을 클릭해서 들어가야 한다면 사용자도 찾기 힘들뿐더러, 검색엔진 봇(스파이더)들도 찾아가 페이지를 인덱스할 확률도 몹시 적어집니다.

그럼 어떻게 하는것이 검색엔진으로 하여금 페이지들을 찾기 쉽게 만드는 것일까요?

가장 좋은 방법은 네비게이션 메뉴에서 모든 페이지로의 이동이 가능하도록 만드는것이 최상책이지만, 이것은 언제까지나 규모가 작은 사이트의 경우이고, 규모가 큰 사이트의 경우는 간편한 네비게이션 메뉴와 더불어 좋은 사이트맵(sitemap)을 만드는 것입니다.

사용이 간편한 네비게이션 메뉴와 사이트맵을 생성하는 것이야 말로 검색엔진 봇에게 사이트 내에 있는 모든 링크를 인덱스 하도록 도와주는 것입니다.

 

사이트맵엔 두가지 종류가 있습니다.

사용자를 위한 사이트맵검색엔진에 등록하기 위한 사이트맵이 있습니다.


1. 사용자를 위한 사이트맵

보통 사이트맵이라고 하면 사용자가 사이트내에서 돌아다니다가 길을 잃었을때, 혹은 어떤 내용이 어디에 있는지 파악하기 쉽게 하기위해 사이트의 모든 링크들을 잘 서술해 놓은 페이지를 사이트맵이라고 합니다.

물론 이 사이트맵은 사용자를 위한 사이트맵이기도 하지만 한편으로는 검색엔진 봇을 위한 사이트맵이라고도 할수 있습니다.

사용자에겐 사이트의 구조를 잘 설명함과 동시에 검색엔진 봇에겐 사이트내에 있는 모든 링크들을 인덱스 할수 있도록 도와주는 역할을 합니다.

좋은 네비게이션을 가진 사이트의 메뉴바는 좋은 사이트맵 역할을 할것이며(텍스트 링크로 되어있을경우), 만약 메뉴바를 플래쉬로 만든경우엔 검색엔진 봇이 링크를 타고 넘어가는 것이 불가능 하므로 사이트 하단에 네비게이션을 텍스트링크로 따로 만들어 놓는것도 적절한 방법입니다.



2. 검색엔진에 등록하기 위한 사이트맵 (구글과 야후)

이것은 여러분들에게 약간 생소할수도 있고 굳이 알고있어야 하는건 아니지만, 검색엔진 최적화를 생각하신다면 반드시 필요한 부분입니다.

대체로 사이트내 모든 링크들을 나열해 만든 .txt 파일, 또는 xml feed(rss feed)가 이에 해당됩니다.


.txt파일의 예를 들자면 메모장을 하나 열어서 아래와 같이 작성하시면 됩니다.

검색엔진 최적화 : 사이트맵 샘플 - sitemap.txt

위와같이 작성한 후에 ftp를 사용해 사이트의 최상단 디렉토리에 업로드 시켜주면 됩니다.

예를들어 제 개인 홈페이지 같은경우엔 사이트맵이 http://www.bmlee.com/sitemap.txt 에 위치하고 있습니다.


rss feed 같은경우엔 블로그나 게시판을 사용하신다면 어렵지 않게 feed를 생성할수 있습니다.

예를들어 그누보들를 사용하시는 경우, 'http://www.사이트이름.com/게시판디렉토리/rss.php?bo_table=게시판이름' 이 rss feed의 주소입니다.

만약 태터툴즈를 사용하신다면 'http://www.사이트이름.com/rss 가 피드주소...라고는 하지만 사실 정확한 주소는 'http://www.사이트이름.com/rss/index.php' 입니다.

위처럼 사이트맵이 준비되는대로 구글과 야후에 등록하면 됩니다.

두가지 모두 있어야하는건 아니고, 둘중 아무거나 있으면 됩니다.

글이 길어지는 관계로 구글 웹마스터툴(http://www.google.com/webmasters/)과 야후(http://siteexplorer.search.yahoo.com/)에 사이트맵을 등록하는 방법은 담번에 알려드리겠습니다.



참고 :
검색엔진 최적화의 기본 : 사이트맵(sitemap)의 중요성
검색엔진 최적화의 기본 : 구글에 사이트맵 등록하기 1
검색엔진 최적화의 기본 : 구글에 사이트맵 등록하기 2
검색엔진 최적화의 기본 : 야후에 사이트맵 등록하기

Posted by Brian Lee

2007/04/26 14:31 2007/04/26 14:31
, , , ,
Response
2 Trackbacks , 8 Comments
RSS :
http://www.seo-korea.com/tc/rss/response/9

Trackback URL : 이 글에는 트랙백을 보낼 수 없습니다

Trackbacks List

  1. 내 블로그를 검색엔진에 최적화 시키기

    Tracked from 소년 Sb의 어른되기 프로젝트 2007/05/31 22:18 Delete

    부제 : 당신의 블로그에 트래픽을 증가시키세요. (구글스럽게) 여기서 써내려갈 내용은 2007년 3월 블로그로 재 오픈하면서 그 동안 sb가 경험했던 검색 엔진 최적화라는 개념의 여러 시도들을 설명하고, 참조했던 자료들을 공유하는 글입니다. (* 우선 많은 블로거분들의 글을 참조했음을 밝히며, 블로그를 처음 접하시는 분들을 대상으로 하겠습니다.) 검색엔진 최적화에 대해서 제가 거창하게 쓸 위치는 아닙니다만, 블로거들이 자신의 생각과 아이디어를 혼자만..

  2. 검색엔진 최적화 웹사이트 만들기

    Tracked from Gorgeous Brand "I" 2009/03/08 22:49 Delete

    요즘 틈틈히 정리하고 있는 숙제 하나. 불황에는 마케팅부서의 영역이 좁아진다. (쓸데 없이)돈쓰는 일 = 마케팅 부서의 업무라는 윗분들의 생각 때문에 새로운 일은 일단 머리속에 keeping. 그리하여 요즘 고민하는 것 중 하나. 온라인 플랫폼을 정비하여 컨텐츠를 노출이 용이한 형태로 재구성하려고 연구하고 있다. 서치 중에 발견한 팁 하나~! 사이트맵의 중요성을 새삼 깨닫게 해주는 글을 담아왔다. 좋은 정보를 알려주신 평상심님에게 감사의 인사를!!

검색엔진 최적화의 기본 : 검색엔진의 인덱스 방지기능 (robots.txt파일과 메타 태그)



검색엔진 최적화에 반드시 필요한것은 아니지만, 기본적으로 알아두시는게 좋습니다.


robots.txt은 로봇 제외 표준이라 불리며, 검색엔진 봇들로 하여금 사이트의 전체, 또는 특정부분의 접근을 제한하게 만드는 역할을 합니다.

robots.txt파일은 검색엔진 봇들로 하여금 어떤 디렉토리는 인덱스가 가능하며, 어떤 디렉토리는 인덱스를 해서는 안된다는 것을 알려줍니다.

검색엔진 봇들 또한 특정 사이트를 방문했을때, 이 robots.txt파일을 제일 먼저 찾게되며, 이 파일에 쓰여있는 내용에 대하여 절대 복종합니다.

robots.txt파일이 없어도 크게 상관은 없습니다.
검색엔진 봇은 모든것을 허용한다는 의미로 받아 들입니다.


기본적으로 robots.txt파일은 최상위 디렉토리에 위치합니다.
예) http://www.bmlee.com/robots.txt


robots.txt파일의 생성

어려운거 하나도 없습니다.
그냥 메모장 하나 열어서

사용자 삽입 이미지


위와같이 작성한 다음, 그냥 업로드 하면 끝입니다.




User-Agent: [스파이더 또는 봇(bot)의 이름]
Disallow: [제외할 디렉토리 또는 파일의 이름]



예를들어 모든 검색엔진 봇을 나타내려면 User-Agent: 뒤에 '*'를 입력합니다.
그리고 제외할 디렉토리또한 아무것도 없을때엔 :

User-Agent: *
Disallow:



반대로 어떠한 검색엔진도 자신의 사이트를 인덱스 하지 못하게 할경우 :

User-Agent: *
Disallow: /

(조심해야 합니다. '/'하나를 붙이느냐 떼어내느냐에 따라 결과는 정 반대가 됩니다.)



특정 디렉토리와 파일을 제외시킬때 :

User-Agent: *
Disallow: /admin
Disallow: /images
Disallow: /secret.html



특정 검색엔진으로 하여금 인덱스를 금지 시킬때 :

User-Agent: Googlebot
Disallow: /admin
Disallow: /images
Disallow: /secret.html



구글봇으로 하여금 인덱스를 하게 하되 네이버봇으로 하여금 특정 디렉토리와 파일 인덱스를 금지 시킬때 :

User-Agent: Googlebot
Disallow:
User-Agent: Naverbot
Disallow: /admin
Disallow: /images
Disallow: /secret.html




특정파일의 로봇 인덱스 금지를 메타태그로 컨트롤 할수도 있습니다.

< meta name="robots" content="index,follow">
(모든 로봇들이 허용되며 링크를 따라가도됨)

또는

< meta name="robots" content="noindex,follow">
(모든 로봇들이 인덱스는 하지말되 링크는 따라가게 만듬)

또는

< meta name="robots" content="index,nofollow">
(모든 로봇들이 인덱스는 하되 링크는 따라가지 못하게 만듬)

또는

< meta name="robots" content="noindex,nofollow">
(모든 로봇들이 인덱스도 허용되지 않으며 링크또한 못 따라가게 만듬)

< meta name="revisit-after" content="7 days"> (7일 후에 다시 방문할것)

위와같이 메타태그를 < head>와 < /head>사이에 끼워놓으면 됩니다.

name의 'robots'는 모든 검색엔진 봇을 의미하며, 특정 검색엔진만을 나타낼때에는 Googlebot, Msnbot, Naverbot과 같이 특정 봇의 이름을 써주시면 됩니다.
content의 'index' 또는 'noindex'는 인덱스를 하느나 마느냐,
'follow'는 페이지 내에 있는 링크들을 따라 가느냐 마느냐를 나타냅니다.

'follow'의 기능은 각각의 링크에서도 컨트롤이 가능합니다.
예를 들에 자신의 페이지에 < a href=http://www.bmlee.com/>이병무의 개인 홈페이지< /a>라는 링크가 있을때, 로봇들이 이 링크를 따라가는것을 원치 않는다면
< a href=http://www.bmlee.com/ rel="nofollow">이병무의 개인 홈페이지< /a>
위와 같이 rel="nofollow" 를 < a> 태그안에 넣어주시면 됩니다.



참조 : http://www.robotstxt.org/

Posted by Brian Lee

2007/04/06 13:01 2007/04/06 13:01
, , ,
Response
0 Trackbacks , 5 Comments
RSS :
http://www.seo-korea.com/tc/rss/response/6

Trackback URL : 이 글에는 트랙백을 보낼 수 없습니다


블로그 이미지

검색엔진 최적화에 대한 모든것!!!

- Brian Lee

Authors

  1. Brian Lee