2018년 10월 28일 일요일

kepler.gl 활용


파이썬이나 R 프로그램을 사용하지 않고 지도에 데이터를 표시하려면 QGIS을 사용합니다. QGIS 기능이 많은 것이 장점이지만  초보자에게 사용이 어려울 수 있고 간단한 작업도 여러 단계를 필요로 합니다. 대신 최근에 우버에서 제공하는 kepler.gl   사이트를 이용하면 지도에 표시하는 몇 가지 기초적인 작업을 쉽게 할 수 있습니다

2016년에 이디야와 스타벅스 커피점들의 거리를 계산하느라 이디야 커피점들의 위도와 경도를 구한 데이터 가 있는데 이 csv 파일에는  가게점명, 주소, 위도(latitude)와 경도(longitude)가 들어 있습니다. 이 파일을 kepler.gl에서 표시하면 아래와 같이 나옵니다. 



아직 다음지도 처럼 세세하게 나오지 않지만 전체적인 내용을 파악하기에는 괜찮습니다. 마우스를 점(point)에 갔다 대면 해당 점의 정보도 나오는데 보이는 정보는  Interactions에서 선택 가능합니다. 여기서 중요한 것은 헤더 이름이 latitudelongitude  된 열은 반드시 있어야 한다는 점입니다. 이 정보를 기반으로 지도에 표시하는데  latitudelongitude 앞뒤에 빈칸이 있어도 안됩니다.  예를 들어 헤더가 “store,addr,latitude,longitude ”longitude 뒤에 빈칸이 있으면 다른 단어로 인식해서 지도에 점이 나오지 않습니다.

단순한 점외에 다른 준비된 표현이 있는데 그 중에 하나가 heatmap입니다. “Add Layer” 를 클릭하고 Layer TypeHeatmap,  Latlatitude 그리고 Lng longitude를 선택하면 밀집도를 기반으로 heatmap를 만들어 줍니다. 아래 그림은 서울을 확대한 것인데 하얀색이 밀집도가 높은 것을 뜻하므로 종로, 강남, 신촌 그리고 금천 등지에 이디야커피점이 집중적으로 존재함을 알 수 있습니다.



표현 중에는 두개점을 이어주는 Arc도 있습니다.  이를 이용해서 서울로 통근 혹은 통학하는 인구수를 지도에 표시할 수 있습니다. 먼저  kosis 에서  2015년 서울로 통근및 통학하는 인구수를 구합니다.  2015년 통계청 인구총조사에 따르면 인천시로부터 서울로 통근/통학 하는 인구수는191,398명이고 경기도부터 서울로 통근/통학하는 인구수는 1,276,803명입니다.  시 혹은 구별 단위로 통근/통학 인구수를 구하고 시청 혹은 구청 주소를 근거로 위경도 정보를 구합니다. 위경도를 구하는 프로그램은 지오코딩 툴으로  기능이 제한적이기는 하지만 무료 버젼이 있습니다.  통학/통근 인구수와 시청/구청 위경도를 합친 파일이  2015u.csv  입니다.  이 파일을 kepler.gl에서 읽고  new layer를 클릭한 다음  Layer TypeArc,  Columns Lat0 latitude1, Lng0 longitude1, Lat1latitude2, Lng1longitude2, Color Based on2015(통근/통학 인구수)를 선택합니다.  그러면 서울, 경기 그리고 인천에 1000개가 넘은 선이 보입니다. 각 선 하나가 지역대 지역별 통근/통학을 의미합니다. 선이 너무 많아 알아 보기 힘드니  Filters를 클릭하고 field2015를 선택합니다.  숫자 범위를 4215에서 24...(실제로는 24497로 분당구에서 강남구로 오는 인구수) 지정해서 이 사이에 들어오는 통학/통근 인구수만 표시합니다.



아래 그램에서 보듯이  역시 모든 주변 도시에서 나온 선들이 강남구로 모이는 것이 두드러지는데 경기도와 인천에서  통근/통학하는 많은 이들이 강남구로 가고 있음을 뜻합니다.



Filters를 이용해서 시간 특성을 가진 데이터도 표시할 수 있습니다.  예제로 사용할 데이터는 20181월부터 8월까지 계약한 아파트매매 건입니다.  계약 데이터는 국토교통부 실거래가 공개시스템  에서 가져 왔고 주소를 기반으로 지오코딩 툴 을 이용하여 위경도 정보를 구하고 이를 합친 것이 부동산-2018p.csv 입니다.   여기서 중요한 것은 시간 형식입니다.  YYYY-MM-DDT00:00:00Z 형식이어야 kepler.gl에서 time으로 인식합니다.  적어도 하나 이상의 time 형식이 있어야 시간의 흐름에 따라 플레이를 할 수 있습니다.

이 파일을 kepler.gl에서 읽고 Filters를 클릭해서 field로 계약일을 지정합니다. 그러면 하단에 시간축이 나오는데 화살표식 위에 있는 네모 두개를 움직여 나타나는 시간 범위를 지정하고 플레이를 시작합니다.  1월부터 8월까지 시간별로  아파트 매매가 어디서 이루어졌는지 보여 줍니다.



데이터를 정리하는데에는 불가피하게 파이썬 프로그램을 이용했지만 kepler.gl 를 통해서는 프로그램 한 줄 없어도  지도에 데이터를 표현하고 분석할 수 있게 합니다.

댓글 없음:

댓글 쓰기