본문 바로가기

Kaggle

캐글(Kaggle) 시작해 보기

머신 러닝을 공부하거나 익숙해지려면 다양한 예제와 데이터를 다루어 봐야 하는데 조직에 속해 있지 않은 이상에 이러한 기회를 접하기가 쉽지 않다 또한 어디에 속해 있다고 하더라도 한 분야의 데이터만 주로 접하기가 쉽다.

 

이 때 유용하게 이용 할 수 있는 곳이 캐글이다. 

캐글은 다양한 예제와 데이터를 제공해주는 곳으로 

 

데이터 사이언티스트와 머신러닝 엔지니어를 위한 온라인 커뮤니티이다. 

https://www.kaggle.com/

 

기업이나 연구소등에서 데이터들이 제공되고 이 데이터를 팀이나 개인이 분석 하여 결과를 예측하여 분석의 정확도로 순위를 정하며 예측 결과가 정확 할 수록 높은 순위를 받게 된다. 

(가장 대표적인 데이터중  하나가 타이타닉 생존자 예측 컴피티션이다.  타이타닉에 승선한 사람들의 데이터가 제공되며 이를 바탕으로 생존을 예측 하는 것이다. ) 

 


 

 

이메일로 가입 할 수 있다. 

 

순위에 따라 메달을 획득하면 게임처럼 레벨업을 할 수 있다. 

각각의 등급은 5가지로 분류 되며 아래로 갈 수록 높은 등급으로 분류 된다. 

novice 는 회원 가입 시 등급이고 contributor 는 프로필 등을 등록 했을 때이고 Expert 부터가 획득한 매달의 갯수와 등급에 따라 나누어 지게 된다. 

 

- Novice 

- Contributor 

- Expert 

- Master 

- Grandmaster 

 

로그인 후의 화면은 다음과 같으며 왼쪽의 Home 밑에 5개의 메뉴로 구성 되어 진다고 보면 될듯 하다. 

 

 

 

 

캐글에 대한 상세한 설명이 있는 글이 있어 링크해 본다.