본문 바로가기

동작구2

lesson learned_2 (동작구 빅데이터활용 공모전) 동작구에서 주최한 빅데이터 활용 정책제안 공모전에 참가한 후 배운 lesson learned을 간단히 정리하고자 한다. 1. 지리 정보 관련 지식 지리 정보에 대한 기초지식이 없어 공모전 내내 상당히 애를 먹었다. 새로 알게된 내용을 정리하고자 한다. 지리 정보는 좌표와 특성 정보로 이루어져있다. 1.1. 좌표계 위경도 좌표를 나타내는 방법으로 다양한 좌표계가 존재한다. 목적에 따라 사용하는 좌표계가 다르며 시각화에서는 주로 EPSG 4326가 사용된다. 지리정보 시각화 패키지인 keplergl을 사용할때도 EPSG 4326 좌표계를 사용했다. 1.2. 파일 형식 - Shape file (.shp) Shape file은 일반적으로 .shp 형식 외에도 .dbf 형식과 .shx 파일 등 몇개의 파일 묶음을.. 2020. 5. 2.
lesson learned_1 (동작구 빅데이터활용 공모전) 동작구에서 주최한 빅데이터 활용 정책제안 공모전에 참가한 후 배운 lesson learned을 간단히 정리하고자 한다. 해당 공모전을 통해 전처리와 분석순서에 대한 기초를 잡을 수 있었다. 또한 전처리와 시각화 부분은 기초적이지만 가장 중요한 부분으로 내가 많이 간과하고 있음을 느꼈다. 시각화를 통한 EDA를 기계적으로 하도록 연습해야겠다. 1. 전처리 2. 시각화 3. 분석 # encoding= "utf8"로 인코딩이 잘 안될 경우 pd.read_csv("./data/data.csv", encoding= "utf8-sig") 1.2. 데이터 재구조화 from pandas import DataFrame data = DataFrame({'cust_ID' : ['C_001', 'C_001', 'C_002',.. 2020. 5. 1.