Q&A

구글봇 차단

2026.01.14 20:10
24
0
CMS/프레임워크 Rhymix 2.1
개발 언어 PHP 7.4

로그를 보면 구글봇이 별 이상한 쿼리를 다 붙여서 오만가지 주소를 긁어가고 있습니다

 

robots.txt 에다가

 

User-agent: Googlebot
Disallow: /*?*search_target=
Disallow: /*?*search_keyword=
Disallow: /*?*division=
Disallow: /*?*last_division=
Disallow: /*?*_filter=
Disallow: /*?*listStyle=
Disallow: /*?*act=disp*

 

이런식으로 설정해주니 

 

/ABC/623425

/EFG/725332?page=2

 

요런 깔끔한 주소만 긁어가고 있는데 이렇게 둬도 괜찮을까요?

차단을 풀어줘야 할 쿼리가 있을까요?

그리고 이런 차단 설정이 전체적인 SEO에 안 좋은 영향을 줄 수 있는지 궁금합니다

댓글 2

  • 짧은주소를 광범위하게 사용하고 계시다면, page와 cpage를 제외한 모든 쿼리는 차단하셔도 됩니다. 구글봇뿐 아니라 모든 검색엔진은 짧은주소만 긁어가도록 해야 합니다. 공홈의 robots.txt를 참고하세요.

     

    특히 일부 게시판 스킨에서 사용자가 게시판 모양이나 정렬 조건을 변경할 수 있도록 허용하는 listStyle, sort_index, order_type 이런 변수들을 긁어가면 정말 골치아픕니다. 어차피 똑같은 내용이라 중복컨텐츠인데...

  • @기진곰

    오 공홈을 참조해서 수정하겠습니다 ^^

    말씀하신대로 스타일부터 정렬 순서에 검색 범위, 검색어 등등을 바꿔가면서 전체 로그의 30%를 구글봇 로그가 차지할 정도네요 ㅜ ㅜ