검색엔진이 내 블로그를 얼마나 긁어 갔는지 아는 방법

워드프레스(wordpress)의 통계툴 중에서 StatTraq  이란 플러그인이 있습니다. 이 플러그인의 기능 중에는 Search Engine Saturation 메뉴를 보면 서치 엔진이 내 블로그의 글을 얼마나 긁어 갔는지 볼 수 있습니다.

http://dobiho.com/wp/gallery/albums/blog/080306205543508.gif

이것의 원리는 간단합니다.
브라우저나 검색 엔진이 웹 서버에 페이지를 요청할 때 마다 자기가 누구인지를  user_agent 라는 필드에 저장해서 보내게 됩니다. 따라서 총 글 중에서 user_agent 별로 통계를 내면 user_agent  별로 얼마나 글을 크롤해 갔는지 알 수 있게 됩니다.

user_agent 의 이름을 알면 되는데, 구글은 Googlebot 이고, 야후!는 Inktomi/Yahoo, MSN은 msnbot 입니다. 네이버는 Bot[NaverBot-1.0 (NHN Corp. / +82-31-784-1989 / nhnbot@naver.com 입니다.

블로그 개설 후 구글,야후!,네이버의 크롤 상태 비교를 해봤는데, 블로그를 개설하고 가만히 두면 네이버는 긁어가지 않는 것 같습니다.

블로그를 만든지 오래 되었는데도 네이버에서 오는 방문자가 없어서 네이버가 내 블로그 글을 얼마나 긁어 갔는지 알아 보기위해서 네이버 user_agent  이름을 알아서 StatTraq의 소스를 수정해 보았습니다.

StatTraq 은 기본으로 google 과 yahoo, msn 검색 엔진의 값을 보여 주는데, 간단히 소스를 수정하면 그림처럼 네이버도 볼 수 있습니다.

http://dobiho.com/wp/gallery/cache/blog/080306205554613.jpg_250.jpg

네이버 검색엔진이 그다지 부지런해 보이지 않습니다. 아니면 제 블로그를 긁어갈 가치가 없던가 둘중에 하나겠죠.

나중에 StatTraq 소스가 업그레이드 될때를 대비해서 수정한 곳을 적어 보면 다음과 같습니다.

search_engine_stats.php 파일을 수정하면 됩니다. 이 파일은 StatTraq 를 설치한 wp-stattraq/reporter 디렉토리안에 있습니다.

1. 65줄 쯤에 검색할 네이버의 user_agent 이름을 지정하기 위해서 다음의 코드를 추가합니다.

$naver = getPageDBResults(“Bot[NaverBot-1.0 (NHN Corp. / +82-31-784-1989 / nhnbot@naver.com”, $date_format, $time_frame, $betweenClause, $orderBy);

2.  네이버 숫자를 초기화 하고, 숫자를 세기 위해서 다음의 소스 코드를 추가 합니다.

$naver_count=0;if($naver)
{
$naver_count = $naver->cnt;
}

3. 결과를 표시하기 위해서 다음을 수정합니다

<table>
<thead>
<tr>
<th></th>
<th>Google</th>
<th>Yahoo</th>
<th>MSN</th>
<th>Naver</th>
</tr>
</thead>
<tbody>

<?php
echo ‘<tr><td>Number of Pages Indexed</td><td class=”right”>’ . $google_count . ‘</td><td class=”right”>’ . $yahoo_count . ‘</td><td class=”right”>’ . $msn_count . ‘</td><td class=”right”>’ . $naver_count . ‘</td></tr>’;
echo ‘<tr><td>Number of Pages <em>Not</em> Indexed</td><td class=”right”>’ . ($total – $google_count) . ‘</td><td class=”right”>’ . ($total – $yahoo_count) . ‘</td><td class=”right”>’ . ($total – $msn_count) . ‘</td><td class=”right”>’ . ($total – $naver_count) . ‘</td></tr>’;
echo ‘<tr><td>Percent Saturation</td><td class=”right”>’ . floor(($google_count/$total)*100) . ‘%</td><td class=”right”>’ . floor(($yahoo_count/$total)*100) . ‘%</td><td class=”right”>’ . floor(($msn_count/$total)*100) . ‘%</td><td class=”right”>’ . floor(($naver_count/$total)*100) . ‘%</td></tr>’;
?>
</tbody>
</table>

수정한 곳을 부분별로 쓰고 따라해서 고치는 것 보다는 그냥 아무 생각없이 파일 하나만 통째로 받아서 수정하려면 다음과 같이 제가  수정한 소스를 덮어 쓰면 됩니다.

1. StatTraq를 설치한 웹 서버의 디렉토리 (wp-stattraq/reporter) 에서 search_engine_stats.php 를 백업 받습니다.
2.search_engine_stats.zip 2K 다운로드 해서 원래 파일에 덮어 씁니다.

검색엔진에서 내 블로그를 얼마나 긁어 갔는지 보려면 매뉴에서 SE Saturation 를 클릭하면 볼 수 있습니다.

http://dobiho.com/wp/gallery/cache/blog/080306205605121.jpg_250.jpg




0 글이 마음에 드시면 하트를 눌러주세요~ 블로거에게 힘이 됩니다 (SNS/로그인/광고 관련 없습니다)


Related Post









이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받고 있습니다.
Scroll Up