캐글2 [Kaggle] IMDB 감정 분석 Part 1 오늘은 캐글 튜토리얼인 IMDB의 영화 리뷰 데이터의 감성분석을 진행해보고자 한다. 깃헙에 한글로 총 4파트로 나누어 친절하게 작성된 코드가 있어 참고고하여 정리해보았다. 아래 출처를 남겨두었다. 순서는 아래와 같다. 원문은 https://www.kaggle.com/c/word2vec-nlp-tutorial이다. Tutorial Part 1 : Preprocessing & Bag Of Words modeling Tutorial Part 2 : Word2Vec & Randomforest modeling Tutorial Part 3 : Word2Vec & K-means algorithm Tutorial Part 4 : TF-IDF & XGBoost algorithm 1. 데이터 수집 2. 데이터 정제 3. .. 2020. 3. 21. [Kaggle] Survival on the Titanic 구글의 예측모델 및 분석 대회 플랫폼인 kaggle의 가장 기초적인 문제를 풀어보았다. 영화로도 유명한 타이타닉호의 생존자를 예측하는 문제이다. 해당 내용은 유투브 채널 오늘의 코드와 허민석, 현재 수강 중인 교육 플랫폼 learnit의 영상을 토대로 작성하였다. 1. EDA 2. Feature engineering 3. 모델 적용 및 타당성 검증 1. EDA **Data Dictionary** - Survival : 0 = No, 1 = Yes - pclass : Ticket class (1 = 1st, 2 = 2nd, 3 = 3rd) - sibsp : # of siblings / spouses aboard the Titanic - parch : # of parents / children aboard .. 2020. 3. 11. 이전 1 다음