본문 바로가기

Python

(4)
[Python][머신러닝][seaborn] - [누락데이터 검출] 목표 : 가장 보편화된 Data 인 Titanic Dataset 을 이용하여 누락데이터 검출방법 알아보기. - 누락데이터 검출이 중요한 이유 ? : 실제로 Big Data 를 다루게 되면, 데이터가 만개, 십만개 이상의 데이터를 다루게 된다. 그럴 경우 하나하나 전부 어디 데이터가 누락되어 있는지 눈으로 찾기는 매우 힘들다. 따라서 Python으로 누락 데이터 검출하는 법을 알아보도록 하자. ​ - 저는 Jupyter Notebook 을 이용합니다. ​ ​ 0. Seaborn , Pandas 라이브러리 설치하기. - 머신러닝을 배우기 전에 보편화된 라이브러리인 Seaborn, Pandas, Matplotlib 정도는 설치해두는 것을 추천한다. ​ - Anaconda prompt에 명령어 을 입력하여 설치..
[Machine Learning][Titanic]- 타이타닉 데이터셋 분석 프로젝트- 1 프로젝트] : 타이타닉 데이터셋 분석 [목표] : 타이타닉 데이터셋을 분석하여, 생존/죽음과 상관관계가 있는 지표들을 찾기 ​ - 다양한 시행착오들을 기록할 예정입니다. ​ ​ 1. Kaggle 에서 제공하는 Titanic Data 다운로드 받기 https://www.kaggle.com/c/titanic/data Titanic: Machine Learning from Disaster Start here! Predict survival on the Titanic and get familiar with ML basics www.kaggle.com ​ 2. 필요한 모듈, 데이터셋 import , isnull().sum() 을 이용하여 결측값 갯수 확인. ​ 3. [Age] 열의 결측값 177개 확인. ​ - ..
[파이썬][데이터분석] - 카카오톡 대화를 워드클라우드(WordCloud)로 [1]! - 타이타닉 선형회귀 함수를 만들다 지쳐서 잠시 흥미로운 주제로 코딩을 했다. - 카카오톡 대화내용을 워드클라우드(WordCloud)로! 라는 주제를 갖고 코딩을 했다. [기본적인 순서] ​ 1. 카카오톡 대화내용을 텍스트파일 (.txt)로 저장한다. : 본인은 PC버전으로 바로 컴퓨터에 다운로드 받았지만, 폰으로 다운하여 메일을 통해 코딩을 하는 컴퓨터로 옮겨주기만 하면 된다. ​ 2. 이번 코딩에서 사용한 모듈들을 불러오자. - 사용하는 모듈 : 1. wordcloud : wordcloud를 생성할 수 있도록 해주는 모듈 2. konlpy : 한글분석을 도와주는 모듈 3. re : 정규표현식 모듈 4. jpype : konlpy를 호출하기 위해 필요한 모듈 5. matplotlib : 워드클라우드 이..
[Python][Anaconda 아나콘다 설치 및 가상환경 구축] 목표 : 아나콘다 설치 및 가상환경 구축 대상 : - 파이썬(python)을 처음 접하시는 분 - 아나콘다 설치를 하였으나, 가상환경 구축을 못하신 분 - Jupyter Notebook 사용시, 모듈(라이브러리)를 설치했으나 import 되지 않는 경우 1. 아나콘다를 다운 받습니다. https://www.anaconda.com/distribution/ - 해당 링크 접속 후, 파이썬 3.7 다운로드를 합니다. 2. 아나콘다 프롬프 (Anaconda Prompt) 를 실행시킵니다. 3. 가상환경 구축 명령어 입력 : 괄호 내부를 입력하시면 되 (가상환경 이름은 본인이 지으시면 됩니다. 저같은 경우는 예시를 위해 myspace 로 하겠습니다.) -입력하시면 마지막줄처럼 Proceed ([y]/n)이 뜹니다..