본문 바로가기

study

lesson learned_2 (동작구 빅데이터활용 공모전)

동작구에서 주최한 빅데이터 활용 정책제안 공모전에 참가한 후 배운 lesson learned을 간단히 정리하고자 한다. 

 

1. 지리 정보 관련 지식

지리 정보에 대한 기초지식이 없어 공모전 내내 상당히 애를 먹었다. 새로 알게된 내용을 정리하고자 한다. 지리 정보는 좌표와 특성 정보로 이루어져있다. 

 

1.1. 좌표계

위경도 좌표를 나타내는 방법으로 다양한 좌표계가 존재한다. 목적에 따라 사용하는 좌표계가 다르며 시각화에서는 주로 EPSG 4326가 사용된다. 지리정보 시각화 패키지인 keplergl을 사용할때도 EPSG 4326 좌표계를 사용했다.

 

1.2. 파일 형식

- Shape file (.shp)

Shape file은 일반적으로 .shp 형식 외에도 .dbf 형식과 .shx 파일 등 몇개의 파일 묶음을 말한다. 공간에 대한 좌표와 특성 정보를 담고 있는 파일들로 모두 한 파일안에 들어있어야 로딩이 된다. 

- Geojson (.geojson)

익히 알고 있는 .json 형식에 지리정보를 담은 것이다. 눈에 띄는 것은 단순히 좌표와 특성정보를 넘어 구역과 범위를 설정한 데이터를 가지고 있다. 좌표를 연결해 폴리곤 형태로 지역을 특정할 수 있다.

 

1.3. 파이썬 패키지

Geopandas : .geojson 이나 .shp 파일을 파이썬에서 판다스형식으로 불러오는 패키지이다. 판다스 형식이다 보니 다소 느림

import geopandas as gpd

df = gpd.read_file('data/data.shp', encoding='cp949')
df = gpd.read_file('data/data.geojson')

 

Fiona : fiona는 파일스트림으로 접근하므로 속도도 빠르고 메모리를 접근할 때 마다 사용한단다. 따라서 대용량 데이터 작업에는 fiona가 더 적합하단다.

import fiona
f = fiona.open('data/data.shp')
f[0]

with fiona.open('data/data.shp') as f:
	item_list = [item for item in f]

 

 

다음에는 실습을 통해 알아보자

 

출처

https://dailyheumsi.tistory.com/141?category=854906

 

[지도 데이터 시각화] Part 1. Geo Data 와 Python

1. Geo Data 1.1. 개념 지도 데이터를 다루기 앞서, 지도 데이터란 무엇이고 어떤 형태로 생겼는지 살펴보려 합니다. 지도 데이터는 일반적으로 '위치' 정보를 담고 있는 데이터입니다. 이 위치는 좌표계에 따라..

dailyheumsi.tistory.com