본문 바로가기

분류 전체보기32

비지도학습 : 데이터 전처리 지도학습의 머신러능 알고리즘에 대해 알아보고 정리를 해보았다. 출처는 아래 남겨두었다. 1. 비지도 학습의 종류 비지도 변환 : 데이터를 새롭게 표현하여 사람이나 다른 머신러닝 알고리즘이 원래 데이터보다 쉽게 해석할 수 있도록 만드는 알고리즘. 가장 널리 사용되는 분야는 특성이 많은 고차원 데이터를 특성의 수를 줄이면서 꼭 필요한 특징을 포함한 데이터로 표현하는 차원 축소이다. 또한 소셜 데이터 분석을 통해 주제를 탐색하는데에도 사용된다. 군집 : 데이터를 비슷한 것끼리 묶는 것을 말한다. 2. 비지도 학습의 도전 과제 비지도 학습은 레이블이 없다보니 무엇이 올바른 출력인지 알 수 없다. 알고리즘에게 우리가 원하는 출력을 알려줄 방법이 없다. 따라서 비지도 학습 알고리즘은 데이터 탐색 단계에서 많이 사용.. 2020. 4. 17.
지도학습 : 커널 서포트 벡터 머신 지도학습의 머신러능 알고리즘에 대해 알아보고 정리를 해보았다. 출처는 아래 남겨두었다. 5. 커널 서포트 벡터 머신 보통 SVM이라고 부른다. 입력 데이터에서 단순한 초평면으로 정의되지 않는 더 복잡한 모델을 만들 수 있도록 확장한 것이다. from sklearn.datasets import make_blobs from sklearn.svm import LinearSVC X, y = make_blobs(centers=4, random_state=8) y = y%2 linear_svm = LinearSVC().fit(X,y) mglearn.plots.plot_2d_separator(linear_svm, X) mglearn.discrete_scatter(X[:,0], X[:,1], y) plt.xlabel(.. 2020. 4. 15.
지도학습 : 결정트리의 앙상블 지도학습의 머신러능 알고리즘에 대해 알아보고 정리를 해보았다. 출처는 아래 남겨두었다. 결정트리에 대한 내용은 생략한다. 4.결정트리의 앙상블 4.1. 앙상블 앙상블(ensemble)은 여러 개의 모형을 만들어 각 모형의 예측을 다수결이나 평균하는 방법이다. 하나의 모형만을 학습시키는 것보다 대체로 나은 결과를 보여준다. 대표적으로 배깅(bagging), 부스팅(boosting) 방법이 있다. 머신러닝 모델과 결합하여 강력한 성능을 낸다. 4.1.1. 배깅 Bagging은 Bootstrap Aggregation의 약자이다. 배깅은 샘플을 여러 번 뽑아(Bootstrap) 각 모델을 학습시켜 결과물을 집계(Aggregration)하는 방법이다. 이를 활용한 모델이 랜덤포레스트이다. 4.1.2. 부스팅(Bo.. 2020. 4. 15.
리그 오브 레전드 승패 예측 API활용 예시를 찾다가 우연히 흥미로운 프로젝트가 있어 필사해보았다. 출처는 아래 남겨두었으며 해당 블로그에서 코드도 함께 공유하고 있으므로 참고하면 된다. 라이엇의 게임 리그 오브 레전드 데이터를 활용하였다. 자세한 코드는 생략했다. 1. 라이엇 API 키 발급 2. 데이터 분석 1. 라이엇 API 키 발급 라이엇 개발자 사이트에 접속하여 회원가입을 하면 API키를 발급받을 수 있다. 일시적으로 발급하는 키라서 최대 허용치가 정해져 있다. 따라서 분석 중에 간혹 데이터 허용치를 초과하여 오류가 나는 경우가 있다. 바로 재발급 받을 수 있다. 귀찮다면 API 키를 정식으로 신청하는 방법도 있다. # 필요한 모듈 설치 import requests import pandas as pd import json .. 2020. 4. 13.