홈페이지 서버 관리: 차단할 IP 주소 목록


대용량 수집이나 해킹 시도 등으로 밝혀진 것이나 내 블로그에 접속한 IP를 방화벽에서 막는다.

IP 막기

해킹 시도나 쓸때 없는 로봇 크롤이나 로봇도 아니면서 그냥 막 긁어 가는 IP들이 있다.

웹 서버에서 bot 들이 xml-rpc 등을 막아도 웹서버가 죽기도 한다.

그래서 방화벽 레벨에서 막을수 있는데 가장 쉬운게 iptables 이다.

일일이 ip를 넣어야 하는데 대역대로 넣는 방법도 있다.

국내 IP 잘 못 막으면 안 된다.

ip를 차단하기 전에 iplocation.com 등에서 국내인지와 통신사를 확인하지만, 해외에서 vpn으로 들어왔다면 국내로 ip로 잡힐 것 같아서 그래도 막았다.

최근에 SK텔레콤에서 메일이 왔다. SKT 사용자 중에 특정 ip영역에서 내 블로그가 접속이 안 된다는 것이다. 찾아보니 내가 대역대로 막았다. 그래서 풀었다.

국내 차단한 IP

222.239.104.*

그런 다음에 차단한 ip 중에서 몇개를 찾아보니 국내ip 가 있어서 풀었다.

그리고 나서 서버 CPU가 막 올라갔다. 구글 어낼리틱스 실시간 5분(어닐래틱스 4에는 5분이 아니라 30분이다 ㅠㅠ)에는 사용자가 평소와 같다.

access.log 를 보니 봇도 아니면서 무지하게 긁어가고 있었다. 그것도 1초당 10개 정도를 긁어가고 있다. 에이전트도 봇도 아니고 그냥 사용자 브라우저 에이전트이다. 봇이라면 30초에 1개 가져가라고 내 블로그의 robots.txt 에 써 놓았는데, 이 IP는 무지막지하다.

검색해보니 2022년 6월 8일에 한 공지 글이 있었다. 1년전 글인데 2023년 7월 21일 현재도 긁어가고 있다. 뭐하는 곳인지 모르겠다.

금일 오전부터 아이피 대역 222.239.104.* 에 대한 차단을 진행하였습니다.

해당 아이피 대역은 금일 오전까지 초당 8건씩 사이트의 게시물을 무단으로 수집(크롤링) 해간 정황이 포착되었습니다.

일반 사용자처럼 접속 시도 하여 데이터를 수집해가고 있어 발견에 어려움이 있었습니다.

데이터 수집의 의도는 알 수 없으나, 무단으로 머신러닝/사이트복제 등에 사용될 가능성이 높습니다.

해당 아이피 대역을 통으로 사용하며 아이피를 돌려가며 수집하고 있어 전역적으로 차단하였음을 알려드립니다.

전문적인 대량수집으로 보여지고, 여타 사이트에서도 크롤링을 시도 하고 있을 가능성이 높습니다.

출처

iptabels 로 IP를 차단했다. 아래 명령어로 222.239.104.* 차단하니 접속이 싹 사라졌다!

sudo iptables -A INPUT -s 222.239.104.0/24 -j DROP

웹 호스팅 업체에 세들어 살면 엔지니어가 알아서 해준다. 아마존 라이트로 옮기고 나서는 돈은 아끼지만 이걸 직접 해야 한다. ㅠㅠ

마치며

IP대역으로 차단할 때 국내인지 확인하고 국내는 일단 차단하지 말아야겠다. 대신 과도한 것은 검색해서 있으면 차단하고 여기에 업데이트 해야겠다.

구글이나 빙 등 몇개 해외 사이트 말고는 다 차단했으면 좋겠는데 방법이 쉽지 않다. 해외를 다 차단하고, 공개된 구글이나 빙 등만 화이트ip로 등록하는 방법을 해야할지도 모르겠다. 매일 로그를 보고 심한 것만 ip 대역대로 차단하고 있는데 귀찮다. 그런다고 자동으로 방화벽을 해주는 걸 설치하기에는 부담 스럽고.. 참 돈을 아끼려고 하니 공부를 해서 머리를 써야하고 부지런해야한다. ㅠㅠ 웹 호스팅에서 엔지니어가 다 해주던 때가 좋았다. 공부해서 하려니 어렵다.







제휴 링크로 구매 시 제휴마케팅 활동의 일환으로 일정액의 수수료를 지급받아 콘텐츠를 제작하는데 큰 도움이 됩니다.



도움이 되셨다면, 댓글이나 소중한 커피 한 잔 부탁드려도 될까요?

커피 사주기



























윗몸일으키기: 윗몸일으키기 카운터

윗몸일으키기 하면 자동으로 횟수 측정, 횟수를 음성으로 세주고, 윗몸일으키기 속도 분석, 일별/월별/연도별 운동 기록 관리









Add a Comment

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다