본문 바로가기

분류 전체보기

matplotlib 을 이용한 선 그래프 그려보기 아나콘다에서 그래프를 그리려면 그래프를 그릴 수 있는 라이브러리를 설치 하고 사용 하여야 한다. 그래프를 그리는 라이브러리는 가장 많이 사용하는 matplotlib을 사용한다. 아래 사이트에서 버전별로 다운 받을 수 있고 샘플 코드도 볼 수 있다. https://matplotlib.org/ 아나콘다를 설치 하였으면 기본으로 설치가 되어 있으므로 import 하여 사용 할 수 있다. import matplotlib.pyplot as plt 이 글 에서는 선 그래프 그리는 방법에 대해 다룰 예정이다. 선 그래프는 1년동안의 매출액, 성장기 키 변화, 다이어트시 몸무게 변화 등 특정 값의 변화에 대해 알고 싶을때 주로 사용 한다. 그래프를 그릴 경우에는 x, y축과 각축에 표시될 값들이 필요 하며 이 값들에 .. 더보기
데이터 시각화의 예 시각화가 사용된 역사적인 예 - 나폴레옹 진군 맵(1812년) 나폴레옹의 모스크바 점령하기 위한 전쟁 당시 파병, 북귀시 병사의 수의 관계를 표시 - 콜레라 발병 맵 (1854년) 콜레라 환자를 지도에 표시해 발병원인이 우물이라는걸 밝혀 냄 - 나이팅게일 로즈 다이어그램 크림전쟁 당시 사망자 수 중 전쟁에서의 부상으로 인한 사망자 수 보다 비위생적이고 열악한 환경으로 인해 사망하는 환자의 수가 더 많다는 것을 밝혀 환경 개선의 근거로 사용 함 데이터의 시각화를 통해 현상파악(나폴레옹 진군 맵), 원인도출(콜레라맵, 로즈 다이어그램), 추세파악/예측을 할 수 있다. - 목적에 따른 그래프의 종류 시간 시각화 - 선 그래프 데이터의 크기 순위 비교 - 막대 그래프 공간 시각화 - 지도위에 표시 하는 그래프 .. 더보기
시작하기 데이터를 사람이 볼 경우에는 수치나 텍스트 형태보다는 시각화된(그래프로 그려진) 데이터가 더 이해하기 쉽고 직관적이다. 이 카테고리는 데이터 시각화 관련되어 공부한 정보들을 정리 할 예정 이다. 아직 공부 하는 단계라 대단한 정보들을 올릴 수는 없겠지만 무언가 작은 도움이 되었으면 좋겠다 :) 시각화 툴 로는 파이썬 아나콘다 기반의 matplotlib 와 seaborn 을 공부하고 다를 예정이다. 더보기
캐글(Kaggle) 타이타닉 풀어보기 2 - 데이터 읽기 csv 파일로 제공 되는 데이터를 읽고 확인 할 수 있다. train = pd.read_csv('../input/titanic/train.csv') test = pd.read_csv('../input/titanic/test.csv') gender_submission = pd.read_csv('../input/titanic/gender_submission.csv') 읽어들인 데이터 확인 하기 head 함수로 일부 데이터를 확인 하여 보면 train 에는 survived 항목이 있고 test 에는 없는걸 알 수 있다 그 외 나머지 항목은 공통적으로 가지고 있다. 각 항목에 대한 정보는 data 탭에서 확인 할 수 있다. Survival : 생존여부 (1=Yes,0=No) Pclass : 티켓.. 더보기
캐글(Kaggle) 타이타닉 풀어보기 1 캐글에 있는 입문용 컴피티션인 타이타닉을 submit 해 보려고 한다. 우선은 캐글사이에서 타이타닉 컴피티션을 선택 해주고 Code 탭을 선택해 새 NoteBook 을 만들어 준다. 새 NoteBook 이 만들어 졌다. 첫 번째 cell 의 내용을 실행하면 어떠한 자료가 있는지 위치와 파일을 보여 준다. kaggle/input/titanic 폴더 안에 train.csv, test.csv, gender_submission.csv 3개의 파일이 있다는걸 알 수 있다. data 탭에서 자료의 자세한 정보를 확인 할 수 있다. - train : 트레이닝 데이터 - test : 테스트 데이터 - gender_submission : 제출 결과 샘플 데이터 더보기
캐글(Kaggle) 문제 해결 흐름 캐글 컨피티션을 해결 하는 순서를 한번 정리해 보았다. (타이타닉 기준) - 문제파악 어떠한 데이터를 가지고 어떤 결과(평가)를 내야 하는지 확인 해야 하며 이는 Overview 에 자세히 설명 되어 있다. The Challenge The sinking of the Titanic is one of the most infamous shipwrecks in history. On April 15, 1912, during her maiden voyage, the widely considered “unsinkable” RMS Titanic sank after colliding with an iceberg. Unfortunately, there weren’t enough lifeboats for everyone o.. 더보기
캐글 노트북(NoteBook) 사용하기 캐글에서 직접 문제를 해결할 수 있는 방법으로 notebook를 제공하고 있다. notebook은 2가지 방법으로 만들 수 있다. - notebook 만들기 1. Code - 왼쪽에 보이는 메뉴에서 Code 를 선택 하여 준다 - 상단의 New NoteBook을 선택해서 새로운 노트북을 만들거나 Your work 를 선택하여 기존에 작성한 노트북을 불러 올 수 있다. 2. Competitions 원하는 컨피티션을 선택 조인 후 Code 메뉴에서 New NoteBook 를 만들 수 있고 하단의 다른 사용자나 팀이 공개한 NoteBook을 볼 수도 있다. - notebook 타이타닉 컨티피션에서 New NoteBook 을 선택해 노트북을 만들면 다음과 같이 노트북이 만들어 진다. 노트북은 cell 단위로 이.. 더보기
캐글(Kaggle) 컴피티션(Competitions) 캐글의 컴피티션 메뉴를 클릭하면 캐글에서 진행중인 Competitions 들을 확인 할 수 있다. - Competitions 왼쪽에 메뉴에서 선택 할 수 있다. - Competitions 메뉴 화면 초보자를 위한 연습용 컨피티선이 먼저 보이고 그 밑에 보이는 것들이 진행중인 컨피티션 들이다. - Competitions 화면 구성 캐글 초보자를 위한 학습용 Competitions 인 타이타닉을 보며 화면에 익숙해 질수 있다. Overview : Competition의 목적, 평가 기준 등을 설명 하고 있다. Data : Competition 에서 사용하는 데이터에 대한 설명 Code : 공개된 NoteBook 과 새 NoteBook을 만들 수 있따. Discussion : Competition 게시판 Le.. 더보기