지난 4월에 국립중앙도서관에서 2018년 우리나라 제목에 가장 많이 출현한 키워드 10개를 발표한 적이 있습니다. 94,321 책을 대상으로 조사했는데 2018년도에는 제목에 사랑, 사람, 우리 등이 많이 등장했었습니다. 외국에는 독자가 기술한 도서 정보와 평가를 볼 수 있는 사이트 https://www.goodreads.com/ 가 있는데 여기서 사람들이
평가를 많이 하는 상위 10,000 책만 뽑은 자료 gookbook 10k 가 있습니다. 이들 책 제목만 추출해서 빈번하게 나타나는 단어를 국립중앙도서관
발표 내용과 같이 나열하면 다음과 같습니다.
국립중앙도서관은 약 10만권을, Goodreads는 만권을 대상으로 하고 있어 빈도의 차이는 있습니다. 상대적 위치인 순위만 의미가 있겠습니다.
우리나라 책에 사랑이 1등이고 Goodreads 데이터에서는 love가 5등입니다. 세계인들도 “love”에 관심이 많음을 알 수 있습니다. 비슷한 관심도는 세상(한국 5위), 세계(10위) , world (Goodreads 8위) 가 있고
당신(한국 7위), you(Goodreads 2위)도 있습니다. 그러나
‘우리’(한국 3위)는 Goodreads에 아예 보이지 않고 대신
my(Goodreads 3위), I (7위), me(10위), 등이
대조적입니다. 행복 (한국 5위) 대신에 night(Goodreads12위),
death(13위), last(15위), dark(20위) 와 같은 암울한 단어가 많이
등장합니다.
Goodreads에 나온 만권이 숫자로는 적지만 사실
단순히 인기도 정보만 있는 것이 아닙니다. 이 만권에 대한 독자의 평가도 포함되어 있어 도서 추천 시스템의
바탕이 됩니다. 국립중앙도서관도 키워드에서
더 나가 실제로 도움이 될 데이터를 앞으로 공개하기를 기대합니다.
댓글 없음:
댓글 쓰기