검색엔진이 내 블로그를 얼마나 긁어 갔는지 아는 방법


워드프레스(wordpress)의 통계툴 중에서 StatTraq  이란 플러그인이 있습니다. 이 플러그인의 기능 중에는 Search Engine Saturation 메뉴를 보면 서치 엔진이 내 블로그의 글을 얼마나 긁어 갔는지 볼 수 있습니다.

 

 

이것의 원리는 간단합니다.
브라우저나 검색 엔진이 웹 서버에 페이지를 요청할 때 마다 자기가 누구인지를  user_agent 라는 필드에 저장해서 보내게 됩니다. 따라서 총 글 중에서 user_agent 별로 통계를 내면 user_agent  별로 얼마나 글을 크롤해 갔는지 알 수 있게 됩니다.

user_agent 의 이름을 알면 되는데, 구글은 Googlebot 이고, 야후!는 Inktomi/Yahoo, MSN은 msnbot 입니다. 네이버는 Bot[NaverBot-1.0 (NHN Corp. / +82-31-784-1989 / nhnbot@naver.com 입니다.

블로그 개설 후 구글,야후!,네이버의 크롤 상태 비교를 해봤는데, 블로그를 개설하고 가만히 두면 네이버는 긁어가지 않는 것 같습니다.

블로그를 만든지 오래 되었는데도 네이버에서 오는 방문자가 없어서 네이버가 내 블로그 글을 얼마나 긁어 갔는지 알아 보기위해서 네이버 user_agent  이름을 알아서 StatTraq의 소스를 수정해 보았습니다.

StatTraq 은 기본으로 google 과 yahoo, msn 검색 엔진의 값을 보여 주는데, 간단히 소스를 수정하면 그림처럼 네이버도 볼 수 있습니다.

 

 

네이버 검색엔진이 그다지 부지런해 보이지 않습니다. 아니면 제 블로그를 긁어갈 가치가 없던가 둘중에 하나겠죠.

나중에 StatTraq 소스가 업그레이드 될때를 대비해서 수정한 곳을 적어 보면 다음과 같습니다.

search_engine_stats.php 파일을 수정하면 됩니다. 이 파일은 StatTraq 를 설치한 wp-stattraq/reporter 디렉토리안에 있습니다.

1. 65줄 쯤에 검색할 네이버의 user_agent 이름을 지정하기 위해서 다음의 코드를 추가합니다.

$naver = getPageDBResults(“Bot[NaverBot-1.0 (NHN Corp. / +82-31-784-1989 / nhnbot@naver.com”, $date_format, $time_frame, $betweenClause, $orderBy);

2.  네이버 숫자를 초기화 하고, 숫자를 세기 위해서 다음의 소스 코드를 추가 합니다.

$naver_count=0;if($naver)
{
$naver_count = $naver->cnt;
}

3. 결과를 표시하기 위해서 다음을 수정합니다

<table>
<thead>
<tr>
<th></th>
<th>Google</th>
<th>Yahoo</th>
<th>MSN</th>
<th>Naver</th>
</tr>
</thead>
<tbody>

<?php
echo ‘<tr><td>Number of Pages Indexed</td><td class=”right”>’ . $google_count . ‘</td><td class=”right”>’ . $yahoo_count . ‘</td><td class=”right”>’ . $msn_count . ‘</td><td class=”right”>’ . $naver_count . ‘</td></tr>’;
echo ‘<tr><td>Number of Pages <em>Not</em> Indexed</td><td class=”right”>’ . ($total – $google_count) . ‘</td><td class=”right”>’ . ($total – $yahoo_count) . ‘</td><td class=”right”>’ . ($total – $msn_count) . ‘</td><td class=”right”>’ . ($total – $naver_count) . ‘</td></tr>’;
echo ‘<tr><td>Percent Saturation</td><td class=”right”>’ . floor(($google_count/$total)*100) . ‘%</td><td class=”right”>’ . floor(($yahoo_count/$total)*100) . ‘%</td><td class=”right”>’ . floor(($msn_count/$total)*100) . ‘%</td><td class=”right”>’ . floor(($naver_count/$total)*100) . ‘%</td></tr>’;
?>
</tbody>
</table>

 

 

수정한 곳을 부분별로 쓰고 따라해서 고치는 것 보다는 그냥 아무 생각없이 파일 하나만 통째로 받아서 수정하려면 다음과 같이 제가  수정한 소스를 덮어 쓰면 됩니다.

1. StatTraq를 설치한 웹 서버의 디렉토리 (wp-stattraq/reporter) 에서 search_engine_stats.php 를 백업 받습니다.
2.search_engine_stats.zip 2K 다운로드 해서 원래 파일에 덮어 씁니다.

검색엔진에서 내 블로그를 얼마나 긁어 갔는지 보려면 매뉴에서 SE Saturation 를 클릭하면 볼 수 있습니다.

 







추천 글





0 글이 마음에 드시면 하트를 눌러주세요~ 블로거에게 힘이 됩니다 (SNS/로그인/광고 관련 없습니다)



당신이 좋아할 만한 글







북트리: 도서관리 & 독서노트
4.5 • 227개의 평가
바코드만 스캔하면 책 정보가 쏙,독서달력,독서통계,독서목표관리,독서노트 등 독서기록 어플












2 Comments

Add a Comment

이메일 주소는 공개되지 않습니다. 필수 항목은 *(으)로 표시합니다















구독하기

이 블로그는 라이프해킹/애플/제주/HCI 관련해 포스팅합니다. 원하는 SNS에서 채널추가나 팔로우하기, 좋아요를 탭하면 블로그에 오지 않고도 새 글을 받아 보실 수 있습니다. 언제든지 SNS에서 취소 할 수 있습니다.

카카오톡에서 새 글 받아보기




트위터에서 새 글 받기




텔레그램에서 새글 받기

텔레그림 채널 구독


페이스북에서 새 글 받기













이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받고 있습니다.