본문 바로가기
study

아파트 분양가격 동향

by 나는야오리 2020. 3. 19.

이번에도 유투브 채널 오늘 코드에 올라온 아파트 분양가격 동향 강의를 따라해보고자 한다. 순서는 다음과 같다. 

1. 데이터 수집
2. 시각화

1. 데이터 수집

공공데이터포털(https://www.data.go.kr/)에 제공하는 전체 민간 신규아파트 분양가격 데이터이며 2020년 1월 기준이다.

# 필요한 모듈 설치
import pandas as pd
import numpy as np
import re
import missingno as msno
import seaborn as sns

# 데이터 로드 및 확인
pre_sale = pd.read_csv('C:/Users/user/Github/Study_Public data/주택도시보증공사_전국 평균 분양가격(2020년 1월).csv', encoding = 'euc-kr',engine='python')
pre_sale.head()
pre_sale.info()
pre_sale.dtypes

1.1. 결측치 확인

pre_sale.isnull().sum()
msno.matrix(pre_sale, figsize=(18,6))

1.2. 데이터 가공

# 분양가격의 타입을 숫자로 변경
pre_sale['분양가격'] = pd.to_numeric(pre_sale_price, errors='coerce')

# 평당 분양가격
pre_sale['평당분양가격'] = pre_sale['분양가격'] * 3.3

pre_sale.head()

# 전국평균 분양가격
pre_sale.groupby(pre_sale.연도).describe().T

# 규모별 가격
pre_sale.pivot_table('평당분양가격','연도','규모구분')

# 지역별 변동액
region_year_all = pre_sale.loc[pre_sale['규모구분']=='전체']
region_year = region_year_all.pivot_table('평당분양가격', '지역명','연도')
region_year

region_year['변동액'] = (region_year['2020'] - region_year['2015']).astype(int)
region_year

2. 시각화

2.1. 막대그래프

막대 끝에 검은 선은 박스플롯의 수염과 같은 표시이다.

plt.figure(figsize=(20, 8))
plt.title('2015-2020년 신규 민간 아파트 분양가격')
sns.barplot(data=region_year_all, x='지역명', y='평당분양가격', hue='연도')

2.2. Box-and-whisker plot

2.2.1. 전체 지역에 대한 연도별 지역별 가격 그래프

pre_sale.head()
pre_sale[['연도','지역명','평당분양가격']].boxplot(by=['연도'], figsize=(18,6))
pre_sale[['연도','지역명','평당분양가격']].boxplot(by=['지역명','연도'], figsize=(18,6), fontsize=12, rot=60)

2.2.2. 서울의 연도별 규모별 평당분양가격

pre_sale.head()
pre_sale[['연도','지역명','평당분양가격']].boxplot(by=['연도'], figsize=(18,6))
pre_sale[['연도','지역명','평당분양가격']].boxplot(by=['지역명','연도'], figsize=(18,6), fontsize=12, rot=60)

마치며

복잡해 보이지만 단순한 데이터였고 그래프 연습하는데 좋았다. 자세한 내용은 아래 출처를 참고하면 된다.

*Reference : https://www.youtube.com/channel/UCLR3sD0KB_dWpvcsrLP0aUg

 

todaycode오늘코드

공공데이터 분석 데이터 시각화 캐글을 통한 머신러닝/딥러닝 튜토리얼 Pandas, Numpy, Scipy, scikit-learn, TensorFlow, Keras, Jupyter, Colaboratory mail : joeunpark@gmail.com

www.youtube.com

'study' 카테고리의 다른 글

러닛 - 자연어 처리 기초  (0) 2020.03.25
[Kaggle] IMDB 감정 분석 Part 1  (0) 2020.03.21
아파트 분양가격 동향  (0) 2020.03.19
스타벅스 이디야 매장 수 비교  (2) 2020.03.19
러닛 - 우주 최초 플립러닝 플랫폼  (0) 2020.03.16
Database 기초  (0) 2020.03.14

댓글0