Q&A

robots.txt를 이용해서 물음표("?") 이하의 주소는 긁어가지 못하도록 차단하는 건 알겠는데요

 

그거 말고도 mid가 노출되거나 노출되지 않는 두 가지가 있는데...

 

("사이트주소/mid/게시글번호" 랑 "사이트주소/게시글번호" 이렇게 두가지)

 

이런건 또 어떻게 해결하나요?

 

보니까 모든 게시글이 중복으로 있는건 아니지만 어떤건 진짜 종류별로 5개도 넘게 뜨더군요

댓글 4

  • 그동안 사이트문서들이 SEO최적화가 안되서 그렇게 색인된 것이니 SEO모듈 적용 제대로 한지 얼마 안되셨으면 그냥 기다리시는게 좋습니다.
    제가 일전에 여러중복주소 못 글억가게 팁을 올렸다가 지웠습니다. 구글에서는 게시글주소 정리를 위해 robots.txt 에서 제한하는 것을 하지 말라고 합니다.

    문서마다 Canonical url 이 잘 들어가게 되면 그주소 위주로 색인을 하게될겁니다.

    하지마세요. 사아트노출에 좋지 않은 영향을 줍니다.
  • @웹지기
    그렇군요. Disallow: /*? 해놨는데 그냥 지우는게 나을까요?

    (그렇다면 robots.txt는 굳이 없어도 되겠네요)

    그리고 한가지 궁금한게... 이거 사이트맵 모듈을 보니까 mid주소가 빠진, 즉 "사이트주소/게시글번호"만 나와 있더군요. 반면에 seo모듈로 생성되는 canonical을 보면 "사이트주소/mid/게시글번호" 형식이던데, 이렇게 될 경우 둘 중 어느게 우선하나요?
  • @기븐
    mid 있는게 정상입니다. 사이트맵도 canonical 적용해서 작성하는게 좋습니다. 제가사용하는 사이트맵 생성기는 해당옵션이 있습니다. 제한한거는 지우세요.
  • @웹지기
    그렇군요. 안그래도 네이버에서 "올바르지 않은 사이트 맵이 제출되었습니다" 라고 나오는 바람에 골치아픈데... 웹지기님처럼 유료 사이트맵 생성기라도 써야 할 판이네요