Q&A

CMS/프레임워크 Rhymix 1.9
개발 언어 PHP 7.1
문제 페이지 주소 비공개 (작성 후 5일 경과)

 https://www.lyrics.co.kr


이런 가사 검색 사이트들은 어떻게 데이터베이스를 구축하는 걸까요?

사람이 하나 하나 입력하는거는 너무 힘들 것 같은데...


크롤링(파싱)해서 데이터를 수집하는 걸까요?


가사 검색 사이트에 갑자기 흥미가 생겨서 만들어보려고 하는데, 어떻게 구축해야될지 모르겠네요..

댓글 5

  • 2019.01.20 07:01 #1152223
    만약에 데이터를 파싱한다면, 모듈 제작 비용은 얼마나 들까요?
  • 2019.01.20 07:01 #1152227
    가사 사이트 같은 경우 저작권에 걸릴 가능성이 있어서 운영에 조심하셔야 합니다. 가사에도 저작권이 걸려있기 때문입니다.
    그리고 lyrics.co.kr 같은 곳은 파싱해서 수집하는 것 같습니다.
  • 2019.01.20 07:06 #1152231
    아 네네 저작권 관련 부분은 담당 협회랑 얘기를 해볼 예정입니다.
  • 2019.01.20 10:29 #1152304

    파싱이나 크롤링이라고 하면 뭔가 원본이 있단 얘긴데..
    보통 가사 데이터의 원본이라고 하면
    1) 유료 MP3에 같이 포함된 가사
    2) 유튜브 자막
    3) 어딘가의 자막 사이트를 크롤링
    이정도를 생각해볼 수 있는데 글쎄요...
    1번 말고는 생각해보기 힘든데요...

    흠.. MP3 말고 DCF 파일에서도 가사 추출이 가능한지

    모르겠습니다.. 그게 가능하다면 대량으로 추출이

    가능할 것 같긴 한데요.

  • 2019.01.20 10:49 #1152326

    만약에 파싱이라면 벅스나 멜론같은 음원 사이트의 정보를 파싱한것이 아닐가 싶습니다