검색엔진이 내 블로그를 얼마나 긁어 갔는지 아는 방법


워드프레스(wordpress)의 통계툴 중에서 StatTraq  이란 플러그인이 있습니다. 이 플러그인의 기능 중에는 Search Engine Saturation 메뉴를 보면 서치 엔진이 내 블로그의 글을 얼마나 긁어 갔는지 볼 수 있습니다.
 
검색엔진이 내 블로그를 얼마나 긁어 갔는지 아는 방법
 
이것의 원리는 간단합니다.
브라우저나 검색 엔진이 웹 서버에 페이지를 요청할 때 마다 자기가 누구인지를  user_agent 라는 필드에 저장해서 보내게 됩니다. 따라서 총 글 중에서 user_agent 별로 통계를 내면 user_agent  별로 얼마나 글을 크롤해 갔는지 알 수 있게 됩니다.
user_agent 의 이름을 알면 되는데, 구글은 Googlebot 이고, 야후!는 Inktomi/Yahoo, MSN은 msnbot 입니다. 네이버는 Bot[NaverBot-1.0 (NHN Corp. / +82-31-784-1989 / nhnbot@naver.com 입니다.
블로그 개설 후 구글,야후!,네이버의 크롤 상태 비교를 해봤는데, 블로그를 개설하고 가만히 두면 네이버는 긁어가지 않는 것 같습니다.
블로그를 만든지 오래 되었는데도 네이버에서 오는 방문자가 없어서 네이버가 내 블로그 글을 얼마나 긁어 갔는지 알아 보기위해서 네이버 user_agent  이름을 알아서 StatTraq의 소스를 수정해 보았습니다.
StatTraq 은 기본으로 google 과 yahoo, msn 검색 엔진의 값을 보여 주는데, 간단히 소스를 수정하면 그림처럼 네이버도 볼 수 있습니다.
 

검색엔진이 내 블로그를 얼마나 긁어 갔는지 아는 방법

 
네이버 검색엔진이 그다지 부지런해 보이지 않습니다. 아니면 제 블로그를 긁어갈 가치가 없던가 둘중에 하나겠죠.
나중에 StatTraq 소스가 업그레이드 될때를 대비해서 수정한 곳을 적어 보면 다음과 같습니다.
search_engine_stats.php 파일을 수정하면 됩니다. 이 파일은 StatTraq 를 설치한 wp-stattraq/reporter 디렉토리안에 있습니다.

1. 65줄 쯤에 검색할 네이버의 user_agent 이름을 지정하기 위해서 다음의 코드를 추가합니다.

$naver = getPageDBResults(“Bot[NaverBot-1.0 (NHN Corp. / +82-31-784-1989 / nhnbot@naver.com”, $date_format, $time_frame, $betweenClause, $orderBy);

2.  네이버 숫자를 초기화 하고, 숫자를 세기 위해서 다음의 소스 코드를 추가 합니다.

$naver_count=0;if($naver)
{
$naver_count = $naver->cnt;
}

3. 결과를 표시하기 위해서 다음을 수정합니다

<table>
<thead>
<tr>
<th></th>
<th>Google</th>
<th>Yahoo</th>
<th>MSN</th>
<th>Naver</th>
</tr>
</thead>
<tbody>

<?php
echo ‘<tr><td>Number of Pages Indexed</td><td class=”right”>’ . $google_count . ‘</td><td class=”right”>’ . $yahoo_count . ‘</td><td class=”right”>’ . $msn_count . ‘</td><td class=”right”>’ . $naver_count . ‘</td></tr>’;
echo ‘<tr><td>Number of Pages <em>Not</em> Indexed</td><td class=”right”>’ . ($total – $google_count) . ‘</td><td class=”right”>’ . ($total – $yahoo_count) . ‘</td><td class=”right”>’ . ($total – $msn_count) . ‘</td><td class=”right”>’ . ($total – $naver_count) . ‘</td></tr>’;
echo ‘<tr><td>Percent Saturation</td><td class=”right”>’ . floor(($google_count/$total)*100) . ‘%</td><td class=”right”>’ . floor(($yahoo_count/$total)*100) . ‘%</td><td class=”right”>’ . floor(($msn_count/$total)*100) . ‘%</td><td class=”right”>’ . floor(($naver_count/$total)*100) . ‘%</td></tr>’;
?>
</tbody>
</table>
 
검색엔진이 내 블로그를 얼마나 긁어 갔는지 아는 방법
 
수정한 곳을 부분별로 쓰고 따라해서 고치는 것 보다는 그냥 아무 생각없이 파일 하나만 통째로 받아서 수정하려면 다음과 같이 제가  수정한 소스를 덮어 쓰면 됩니다.

1. StatTraq를 설치한 웹 서버의 디렉토리 (wp-stattraq/reporter) 에서 search_engine_stats.php 를 백업 받습니다.
2.search_engine_stats.zip 2K 다운로드 해서 원래 파일에 덮어 씁니다.

검색엔진에서 내 블로그를 얼마나 긁어 갔는지 보려면 매뉴에서 SE Saturation 를 클릭하면 볼 수 있습니다.
 







제휴 링크로 구매 시 제휴마케팅 활동의 일환으로 일정액의 수수료를 지급받아 콘텐츠를 제작하는데 큰 도움이 됩니다.



도움이 되셨다면, 댓글이나 소중한 커피 한 잔 부탁드려도 될까요?

커피 사주기
























당신이 좋아할 만한 글







플랭크스타: 플랭크 타이머

목표 시간, 세트 등 다양한 방식을 지원하는 플랭크 타이머, 음성 안내, 일별/월별/연도별 운동 기록 관리









2 Comments

Add a Comment

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다