자료실

Thumbnail

구충제 모듈

2024.10.27 06:42
900
25
자료 유형 모듈
간단한 소개 서버 자원과 트래픽을 낭비하는 기생충 로봇을 차단합니다.
설치 경로 ./modules/allbandazole
코어 지원 범위 Rhymix 2.1
PHP 지원 범위 기타
자료 구분 공개 자료
라이선스 GPL v2
저장소 URL https://github.com/poesis/rhymix-allbandazole
파일명버전날짜용량다운로드 수
allbandazole-1.0.0.zip 1.0.0 2024.10.27 16.1KB 142

ALL-BAN-d'azole

Antiparasitic module for Rhymix

 

귀중한 서버 자원과 트래픽을 쪽쪽 빨아먹는 기생충 같은 로봇들을 차단합니다.

널리 알려진 불량 로봇 목록이 기본 적재되어 있습니다.

암 예방에 도움이 될지도 모릅니다.

 

불량 로봇으로 간주하는 기준은

1) 검색 노출을 통한 방문자 유입, SNS 공유, 광고 수익 등 명백한 혜택을 주지 않으면서

2) 운영자의 동의 없이 국내 홈페이지를 대량으로 크롤링하여

3) 서버 부하 증가, 해외 트래픽 요금 등의 피해를 입힌 이력이 있는 user-agent 또는 IP 대역입니다.

 

통계 작성이나 마케팅을 위한 데이터 수집, AI 학습 데이터 수집은 대부분 해당됩니다.

(만약 특정 업체의 크롤링에 동의하셨다면 해당 user-agent나 IP 대역을 목록에서 제외하세요.)

국내 호스팅 환경 특성상, 해외 로봇은 거의 다 3번에 걸립니다만

링크를 공유했을 때 일회성으로 페이지 정보를 가져가는 로봇은 예외로 하였습니다.

 

물론 .htaccess나 서버 설정으로 차단하는 것이 훨씬 더 효율적이겠지만,

웹호스팅에서는 서버 설정을 임의로 수정하기도 어렵고

.htaccess를 수정하면 코어 업데이트시 덮어씌워질 수 있으므로

좀더 관리하기 편한 방법을 제공합니다.

 

서버에서 이미 불량 로봇을 차단하고 있는 경우, 이 모듈을 사용하지 않으셔도 됩니다.

 

image.png

 

차단된 로봇에게는 아파치나 nginx의 기본 403 Forbidden 화면과 똑같은 화면을 던져줍니다.

User-agent 목록을 수정하실 경우, 정상적인 방문자를 차단하지 않도록 조심하세요.

 

image.png

 

작동 환경: 라이믹스 2.1.x 최신 버전 (2024년 이후 릴리즈)

기진곰 Lv. 26
이 구역의 전속 곰탱이입니다. 라이믹스를 개발하고 있어요.

댓글 23