본문 바로가기

분류 전체보기

(35)
지도학습 : 커널 서포트 벡터 머신 지도학습의 머신러능 알고리즘에 대해 알아보고 정리를 해보았다. 출처는 아래 남겨두었다. 5. 커널 서포트 벡터 머신 보통 SVM이라고 부른다. 입력 데이터에서 단순한 초평면으로 정의되지 않는 더 복잡한 모델을 만들 수 있도록 확장한 것이다. from sklearn.datasets import make_blobs from sklearn.svm import LinearSVC X, y = make_blobs(centers=4, random_state=8) y = y%2 linear_svm = LinearSVC().fit(X,y) mglearn.plots.plot_2d_separator(linear_svm, X) mglearn.discrete_scatter(X[:,0], X[:,1], y) plt.xlabel(..
지도학습 : 결정트리의 앙상블 지도학습의 머신러능 알고리즘에 대해 알아보고 정리를 해보았다. 출처는 아래 남겨두었다. 결정트리에 대한 내용은 생략한다. 4.결정트리의 앙상블 4.1. 앙상블 앙상블(ensemble)은 여러 개의 모형을 만들어 각 모형의 예측을 다수결이나 평균하는 방법이다. 하나의 모형만을 학습시키는 것보다 대체로 나은 결과를 보여준다. 대표적으로 배깅(bagging), 부스팅(boosting) 방법이 있다. 머신러닝 모델과 결합하여 강력한 성능을 낸다. 4.1.1. 배깅 Bagging은 Bootstrap Aggregation의 약자이다. 배깅은 샘플을 여러 번 뽑아(Bootstrap) 각 모델을 학습시켜 결과물을 집계(Aggregration)하는 방법이다. 이를 활용한 모델이 랜덤포레스트이다. 4.1.2. 부스팅(Bo..
리그 오브 레전드 승패 예측 보호되어 있는 글입니다.
Youtube 댓글 크롤링 보호되어 있는 글입니다.
지도학습 : 나이브베이즈 지도학습의 머신러능 알고리즘에 대해 알아보고 정리를 해보았다. 출처는 아래 남겨두었다. 3. 나이브 베이즈 분류기 나이브 베이즈에서 나이브는 순진하다라는 뜻으로 모든 데이터의 특징을 동등하고 독립적이라고 가정하기 때문에 비롯되었다. 이 분류기를 이해하기 위해서는 베이즈 정리를 이해해야한다. 나이브 베이즈는 조건부확률에 대한 수학적 정리를 통해 어떤 사건을 추론할 수 있는것이다. 날씨 예제를 통해 나이브 베이즈 좀더 자세히 알아보자 Feature가 하나일 때 나이브 베이즈 분류문제 1. 날씨가 overcast일 때 경기를 할 확률은? P(Yes|Overcast) = P(Overcast|Yes) P(Yes) / P(Overcast) 1. 사전 확률 P(Overcast) = 4/14 = 0.29 , P(Yes..
지도학습 : 선형 모델 지도학습의 머신러능 알고리즘에 대해 알아보고 간단히 정리를 해보았다. 2. 선형모델 선형 모델은 입력 특성에 대한 선형 함수를 만들어 예측을 수행한다. 예를 들어 2차원 평면에 랜덤하게 100개의 좌표가 점으로 찍혀있을때 모든 점을 지나는 하나의 선은 그을 수 없다. 우리는 실제와 비슷한 선을 예측하여 그릴 뿐이다. 이 때 예측하는 선과 실제 점 사이에 오차가 발생한다. 이를 최소하는 것이 예측력을 높이는 중요한 과제이다. 그리고 오차를 줄이는 방법에 따라 다양한 모델이 있다. 다음으로 선형 회귀에 어떤 모델이 있는지 간단히 알아보자. 2.1 예측모델 2.1.1. Bias와 Variace, 오차 그리고 정규화 선형 회귀 모델의 종류를 살펴보기 전에 알아둬야하는 내용이 있다. 첫번째로 Bias와 Varia..
지도학습 : KNN 최근접 이웃 알고리즘 지도학습의 머신러능 알고리즘에 대해 알아보고 정리를 해보았다. 출처는 아래 남겨두었다. 1. KNN(K-Nearest Neighbor) 최근접 이웃 알고리즘 1.1. 특징 - 가장 간단한 머신러닝 알고리즘 - 새로운 데이터를 예측할 때 가장 가까운 데이터로 예측하는 방법 - 이웃(범위)의 수를 설정해주어야 한다 - 거리는 유클리디안 거리방식을 사용한다 1.2. 장단점 - 훈련 세트의 수나 피쳐 수가 많을 경우 예측이 느려진다 - 부분의 값이 0일 경우 잘 작동하지 않는다 - 쉽지만 예측이 느리고 여러 피쳐를 처리하기에는 성능이 부족해 현업에서는 잘 쓰지 않는다 1.3. KNN을 활용한 분류와 회귀 # 필요한 모듈 설치 !pip install numpy scipy matplotlib ipython scik..
라이브러리 모듈 패키지 차이 헷갈리는 개념 1. 모듈 (moule) 모듈은 데이터, 함수, 클래스 등이 담겨져있는 파일을 말한다. 내장 함수가 아닌 외장 함수의 경우 외부의 라이브러리(모듈)을 사용하기 위해서는 따로 import 하는 작업이 필요하다. 예를 들어 늘 하는 import가 바로 그것 import pandas as pd 2. 패키지 비슷한 모듈의 집합을 말한다. 아래는 urllib2 모듈에서 request 모듈 불러오는 것 from urllib2 import request 3. 라이브러리 패키지와 비슷한 개념이라고 보면 된다. R 유저라면 다르게 생각할 수 도 있다. R의 경우 cran이라는 패키지를 모아둔 사이트로부터 패키지를 로컬 pc로 내려받아 사용하는데 이때 내려받아 저장해두는 곳을 라이브러리라 칭한다. 다시 말해..