본문 바로가기

Python/Projects

(2)
[Machine Learning][Titanic]- 타이타닉 데이터셋 분석 프로젝트- 1 프로젝트] : 타이타닉 데이터셋 분석 [목표] : 타이타닉 데이터셋을 분석하여, 생존/죽음과 상관관계가 있는 지표들을 찾기 ​ - 다양한 시행착오들을 기록할 예정입니다. ​ ​ 1. Kaggle 에서 제공하는 Titanic Data 다운로드 받기 https://www.kaggle.com/c/titanic/data Titanic: Machine Learning from Disaster Start here! Predict survival on the Titanic and get familiar with ML basics www.kaggle.com ​ 2. 필요한 모듈, 데이터셋 import , isnull().sum() 을 이용하여 결측값 갯수 확인. ​ 3. [Age] 열의 결측값 177개 확인. ​ - ..
[파이썬][데이터분석] - 카카오톡 대화를 워드클라우드(WordCloud)로 [1]! - 타이타닉 선형회귀 함수를 만들다 지쳐서 잠시 흥미로운 주제로 코딩을 했다. - 카카오톡 대화내용을 워드클라우드(WordCloud)로! 라는 주제를 갖고 코딩을 했다. [기본적인 순서] ​ 1. 카카오톡 대화내용을 텍스트파일 (.txt)로 저장한다. : 본인은 PC버전으로 바로 컴퓨터에 다운로드 받았지만, 폰으로 다운하여 메일을 통해 코딩을 하는 컴퓨터로 옮겨주기만 하면 된다. ​ 2. 이번 코딩에서 사용한 모듈들을 불러오자. - 사용하는 모듈 : 1. wordcloud : wordcloud를 생성할 수 있도록 해주는 모듈 2. konlpy : 한글분석을 도와주는 모듈 3. re : 정규표현식 모듈 4. jpype : konlpy를 호출하기 위해 필요한 모듈 5. matplotlib : 워드클라우드 이..