본문 바로가기

분류 전체보기37

2021년 2월 회고 1. Job hunting 데이터 분석 직무 인턴으로 일을 시작하게 되었다. 사업부 소속으로 마케팅, 매출, 비즈니스와 관련된 데이터를 다루게 될 듯하다. 유저 사이트(User Site)의 데이터를 다루지 못해 아쉬우나 이렇게나마 일을 시작할 수 있어 다행이다. 면접 당시 SQL에 대한 질문이 있었다. 간단한 쿼리문은 작성할 줄 알지만 실무에서 사용해본 적이 없다고 답했다. 입사 전까지 남은 기간 동안 SQL을 익힐 생각이다. 빠르게 적응하고 가용 시간을 확보해야겠다. 2. 계획 수정 연초에 계획했던 목표를 반만 달성했다. 애초에 높게 잡은 터라 수정이 필요하다. 건강을 위해 시작한 러닝은 목표치를 달성했고 꾸준히 해내는데 별 문제 없어 보인다. 하지만 공부 계획은 앞으로 일을 시작하게 되면 더더욱 달성.. 2021. 3. 1.
평균의 종말 - 토드로즈 1부 평균의 시대 1장 평균의 탄생 케틀레 - 자연을 이해하려는 노력이 과학과 수학을 발전시켰고 19세기 과학자 케틀레는 이를 인간 사회에 대입하여 사회 과학으로 발전시켰다. 마침 19세에는 일명 활자화된 숫자의 쇄도기였다. 유럽 각국에선 군인, 인구 등 국가를 이루는 것들을 조사하기 시작할 시기였다. 케틀레는 천문학에서 주로 사용하는 평균법을 사람에게 응용하였고 이것이 사회의 개개인관에 변화를 일으켰다. 골턴 - 케틀레와 같이 평균 신봉자이나 평균에서 벗어난 이들을 오류라는 의견에는 동의하지 않았다. 사람으로 치면 계층이 존재하고 평균 이상인 경우 이는 오류가 아닌 우월한 계층에 속한다는 것이다. 평균에서 벗어난 것은 오류에 해당한다고 간주한 케틀레, 이에 반해 골턴은 평균을 정상의 개념에서 평범함의 .. 2021. 2. 14.
Mecab 사용자 사전 추가하기 mecab에서는 사용자가 사전을 구축할 수 있도록 지원한다. 따라서 자연어 처리시 분석 품질을 높일 수 있다. 한국어 임베딩에서 제공하는 코드를 통해 진행해보았다. 추가로 konlpy를 윈도우 환경에서 실행시키다보면 환경 세팅이 까다롭다. 따라서 도커(docker)를 활용하여 리눅스 환경에서 설치해보았다. 1. Docker 컨테이너 빌드 우선 Docker 설치 후 한국어 임베딩 깃허브 사이트에서 제공하는 Dockerfile로부터 도커이미지 생성 및 컨테이너를 띄운다. 노트북이라 CPU 파일로 빌드했으며 아래 코드는 터미널에서 작성했다. git clone https://github.com/ratsgo/embedding.git cd embedding docker build -t ratsgo/embedding.. 2021. 2. 10.
2021년 1월 회고 0. 퇴사 매월 회고를 해볼 생각이다. 그 전에 2020년 하반기를 정리하고 싶다. 6개월 동안 인턴으로 근무했던 스타트업에서 나왔다. 정규직 제안을 받았으나 승낙하지 않았다. 대우나 회사의 방향도 좋았지만 직무가 맞지 않았다. 1년을 버틴다고 해도 도 내 커리어에 맞지 않는 직무였다. 취업을 준비하면서 보낸 지난 시간과 앞으로의 1년을 위해 다시 취업 준비를 하기로 했다. 값진 시간이었다. 좋은 사람들과 즐겁게 일하면서 어떻게 일할 것인가에 대한 나만의 가치관을 세울 수 있었다. 최고의 동료가 되자. 내 영향력을 확보해야 한다. 쉽고 명확하게 소통해야 한다. - 수용자를 배려해야 한다. 본인의 역량을 객관적으로 파악해야 한다. - 일감 관리를 못하는 것은 민폐다. 야근은 실력이 아니다. 생각을 글로 적.. 2021. 1. 31.
그릿(Grit) - 앤절라 더크워스 총 3부 13장으로 구성된 책이다. 책 내용 일부와 개인적인 생각을 정리해보았다. 1부 그릿이란 무엇인가 제 1장 그릿, 성공의 필요조건 35 페이지 재능과 재능을 발휘하는 것는 별개의 것이다. 모두 잠재력을 가지고 태어난다. 하지만 모두 이를 발휘할 수 있을 정도로 노력하지 않는다. 제 2장 우리는 왜 재능에 현혹되는가? 57 페이지 재능에만 집착하는 자세가 해로울 수 있는 이유는 ··· 재능만 집중 조명함으로써 나머지 모두를 가리 위험이 있기 때문이다. 제 3장 재능보다 두배 더 중요한 노력 63 페이지 탁월성은 평범함에서 나온다. 최상급 기량은 사실 수십 개의 작은 기술 및 동작 하나하나를 배우거나 우연히 깨치고, 주의 깊은 연습을 통해 습관으로 만들고, 전체 동작으로 종합해서 나온 결과물이다. 부.. 2021. 1. 30.
슬랙봇(Slack bot) 만들기 회사를 다니면서 헬스케어 산업에 대한 관심이 많아졌다. 따라서 슬랙을 활용하여 관련 뉴스를 받아보는 뉴스봇을 개발해보았다. 1. 개요 : Webhook을 통해 특정 사이트의 특정 키워드를 포함하는 뉴스기사를 슬랙 App을 통해 전달 2. 사이트 : Platum - 스타트업 전문 미디어 3. 키워드 : 헬스, 케어, 금융, 핀테크 - 관심사 키워드 1. 패키지 설치 # 패키지 설치 import time import requests import datetime import json from bs4 import BeautifulSoup 2. 코드 최근 1주일 동안 위의 키워드를 포함하는 뉴스 기사를 크롤링해보기로 했다. keyword_list = keyword_list # 키워드 설정 n = n # 키워드당 .. 2020. 12. 31.