레퍼러 스팸(refereer spam) 막기


구글 어낼리틱스를 보니 사이트의 트래픽이 갑자기 급증 했다.  메인 지표가 늘지 않았는데 이상해서 레퍼러를  봤다.

 

bottraffic4free.club 에서 들어온 트래픽이 급증 했다. 들어가봤더니 https://www.gammatraffic.com/ 로 리다이렉트된다.

아! 이른바 레퍼러 스팸이다.  레퍼러 스팸은 내 사이트가 레퍼 된 곳을 알려서  들어가면 다른 사이트로 리다이렉션해서  사이트를 홍보 한다.

http 프로토콜은 문서 요청을 할 때 현재 문서의 위치도 같이 요청하고 웹 서버는 로그에 남긴다. 웹 사이트 분석 툴 같은 구글 어낼리틱스는 이걸 참조 사이트로 해서 분석해주는 데 이 원리를 이용해서 레퍼로로 스팸을 날리는 것이다. 이놈의 마케팅은 기술도 잘 이용한다.

인터넷이 생기고 나서 오프라인의 광고 편지인 이른바 스팸 메일은 그대로 인터넷에 나타났다. 몇 십년이 지나고서야 국가마다 사전 동의를 해야 한다고 법이 만들어졌다. 그러나 이런 스팸 트래픽은 아직 규제가 없다. 검색 엔진이 사이트를 돌아다니며 크롤링 하는 것도 robot.txt 라는 에티켓 같은 것만 있는데 이건 안지켜도 되는 거라 규제는 없다. 검색 엔진 크롤링을 규제와 포탈이나 검색엔진의 수익은 오래된 이슈이기도 하다.

이 스팸 레퍼를 통한 트래픽은 관리자가 제대로 트래픽을 못 보게 할 뿐만 아니라 웹 서버의 부하도 준다.

웹 호스팅은 보통 하드 용량과 트래픽 용량으로 비용을 지불하니 스팸 트래픽이 내 정상 사용자를 위한 트래픽 비용을 다 써버리거나 종량제가 아닐 경우 비용을 더 나올 수도 있다.

그래서 다음 두 가지를 했다.

  • 구글 어낼리틱스에서 스팸 레퍼러 필터 해서 안보이게 하기
  • 웹 서버에 못 들어오게 막기

 

구글 어낼리틱스에서 스팸 레퍼러 필터링 하기

구글 어낼리틱스에서는 필터링을 할 수 있게 해준다. 다만 기존 데이터에는 적용되지 않고 새로 들어온 트래픽에만 적용된다. 소급되지 않으니 정말 불편하다.

 

도메인 이름으로 제외하기

방법은 다음과 같다.

 

  1. 구글 어낼리틱스의 관리자 메뉴에서 해당 뷰의 필터를 탭 한다.
  2. 필터 목록에서 ‘필터 추가’ 를 클릭해서 필터를 만든다
  3. 다음 화면 처럼 펄터 유형을 맞춤으로 하고 캠페인 소스에 레퍼러에 나온 이름을 입력한다.

 

한개씩 필터를 만들어도 되지만 만들 수 있는 필터 수가 제한이 있다. 그래서 필터 패턴에 정규식 형식으로 계속 추가할 수 있다.

 

 

 

 

IP 로 제외하기

IP로 막을 수도 있다. 마찬가지로 여러개의 IP를 넣을 수 있다.

 

 

웹 서버에 IP 못 들어오게 막기

검색엔진 처럼 유저에이전트를 치팅 하면 robots.txt  에도 하면 되는데, 이건 레퍼러 스펨이라 ip 를 막을 수 있다.

bottraffic4free.club 를 ping 해보니 ip 가 104.27.179.139   이다. 언제 변할지는 모르겠지만 일단 막았다.

.htaccess 로 막기

디렉토리에 .htaccess 파일을 열고, 없으면 만들고 다음을 추가한다.

 

Order Allow,Deny
Allow from all

# bottraffic4free.club
Deny from 104.27.179.139

 

이렇게 하면 웹 서버가 막기 때문에 보낸 쪽에서는 접속을 못하니 ip 를 바꿔서 들어올 수 있다.  뭐 보안이랑 창과 방패이니 서로 대응하는 수 밖에 없다.

전에 회사 사이트에 구글 어낼리틱스를 달고 나서 러시아에서 온 스팸 레퍼러 때문에 이 방법을 배웠는데 여전히 유효한 것 같다.


0 글이 마음에 드시면 하트를 눌러주세요~ 블로거에게 힘이 됩니다 (SNS/로그인/광고 관련 없습니다)


















이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받고 있습니다.
이 포스팅은 제휴마케팅이 포함된 광고로 일정 커미션을 지급 받을 수 있습니다.