본문 바로가기

study

아파트 분양가격 동향

이번에도 유투브 채널 오늘 코드에 올라온 아파트 분양가격 동향 강의를 따라해보고자 한다. 순서는 다음과 같다. 

1. 데이터 수집
2. 시각화

 

1. 데이터 수집

공공데이터포털(https://www.data.go.kr/)에 제공하는 전체 민간 신규아파트 분양가격 데이터이며 2020년 1월 기준이다.

# 필요한 모듈 설치
import pandas as pd
import numpy as np
import re
import missingno as msno
import seaborn as sns

# 데이터 로드 및 확인
pre_sale = pd.read_csv('C:/Users/user/Github/Study_Public data/주택도시보증공사_전국 평균 분양가격(2020년 1월).csv', encoding = 'euc-kr',engine='python')
pre_sale.head()
pre_sale.info()
pre_sale.dtypes

 

1.1. 결측치 확인

pre_sale.isnull().sum()
msno.matrix(pre_sale, figsize=(18,6))

 

1.2. 데이터 가공

# 분양가격의 타입을 숫자로 변경
pre_sale['분양가격'] = pd.to_numeric(pre_sale_price, errors='coerce')

# 평당 분양가격
pre_sale['평당분양가격'] = pre_sale['분양가격'] * 3.3

pre_sale.head()

 

# 전국평균 분양가격
pre_sale.groupby(pre_sale.연도).describe().T

# 규모별 가격
pre_sale.pivot_table('평당분양가격','연도','규모구분')

 

# 지역별 변동액
region_year_all = pre_sale.loc[pre_sale['규모구분']=='전체']
region_year = region_year_all.pivot_table('평당분양가격', '지역명','연도')
region_year

region_year['변동액'] = (region_year['2020'] - region_year['2015']).astype(int)
region_year

 

2. 시각화

2.1. 막대그래프

막대 끝에 검은 선은 박스플롯의 수염과 같은 표시이다.

plt.figure(figsize=(20, 8))
plt.title('2015-2020년 신규 민간 아파트 분양가격')
sns.barplot(data=region_year_all, x='지역명', y='평당분양가격', hue='연도')

 

2.2. Box-and-whisker plot

2.2.1. 전체 지역에 대한 연도별 지역별 가격 그래프

pre_sale.head()
pre_sale[['연도','지역명','평당분양가격']].boxplot(by=['연도'], figsize=(18,6))
pre_sale[['연도','지역명','평당분양가격']].boxplot(by=['지역명','연도'], figsize=(18,6), fontsize=12, rot=60)

 

2.2.2. 서울의 연도별 규모별 평당분양가격

pre_sale.head()
pre_sale[['연도','지역명','평당분양가격']].boxplot(by=['연도'], figsize=(18,6))
pre_sale[['연도','지역명','평당분양가격']].boxplot(by=['지역명','연도'], figsize=(18,6), fontsize=12, rot=60)

 

마치며..

복잡해 보이지만 단순한 데이터였고 그래프 연습하는데 좋았다. 자세한 내용은 아래 출처를 참고하면 된다. https://www.youtube.com/channel/UCLR3sD0KB_dWpvcsrLP0aUg

 

todaycode오늘코드

공공데이터 분석 데이터 시각화 캐글을 통한 머신러닝/딥러닝 튜토리얼 Pandas, Numpy, Scipy, scikit-learn, TensorFlow, Keras, Jupyter, Colaboratory mail : joeunpark@gmail.com

www.youtube.com

'study' 카테고리의 다른 글

러닛 - 자연어 처리 기초  (0) 2020.03.25
[Kaggle] IMDB 감정 분석 Part 1  (0) 2020.03.21
아파트 분양가격 동향  (0) 2020.03.19
스타벅스 이디야 매장 수 비교  (2) 2020.03.19
러닛 - 우주 최초 플립러닝 플랫폼  (0) 2020.03.16
Database 기초  (0) 2020.03.14