Data scientist/kaggle

[kaggle] 간단한 kaggle 사용법

반응형

kaggel 이란?

 

캐글은 2010년 설립된 예측모델 및 분석 대회 플랫폼이다. 기업 및 단체에서 데이터와 해결과제를 등록하면, 데이터 과학자들이 이를 해결하는 모델을 개발하고 경쟁한다.

 

 

www.kaggle.com/

 

Kaggle: Your Machine Learning and Data Science Community

Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.

www.kaggle.com

 

해당 사이트의 주소이다.

 


자주 쓰는 카테고리 설명

 

 

옆에를 보면 카테고리가 있다. 하나씩 간단하게 설명하면 

 

 

# Compete

 

compete에서는 지금 현재 상금을 걸고 대회를 하고 있는 것들이 있다. 여기에는 기업에서 어떠한 문제를 해결하기 위해 데이터를 주고 상금을 걸어 competitions을 한다.

 

# Data

여기에는 다양한 데이터 셋이 있다. 이 데이터셋을 통해 머신러닝이나 딥러닝을 할 수 있다. 여기서 원하는 데이터를 얻을 수 있다.

 

# Notebook

Notebook 에서는 사람들이 데이터를 가지고 작업을 한 것을 볼 수 있다. jupyter 같은 느낌이라고 보면 된다. 여기서 남들이 어떻게 했는지 내 거와 비교하면서 공부할 수 있다.

 

보통 이정도를 주요하게 많이 쓴다.

 


데이터셋 보기

 

해당 competitions이나 dataset을 들어가면 

 

 

이런 창으로 이어진다. 여기서 data를 누르면

 

 

 

이렇게 데어서 셋이 나오고 이것을 다운로드할 수 있다. 또한 데이터에 대한 간단한 설명까지 볼 수 있다.

 

 


 

# 다른 사람의 Notebooks 

 

Data라는 부분 옆에 Notebooks이라는 것을 누르면 사람들이 해당 데이터 셋에 대해 올린 Notebook이 있다. 남들이 한 것을 통해 참고할 수도 있고 내 것과 비교할 수도 있다.

 

 

 


 

# Notebook 작성

 

해당 버튼을 클릭하면 아래와 같은 창으로 이동한다. 

 

여기서 해당 Notebook으로 Create를 하게 되면 

 

 

이런 창으로 넘어간다. 여기에는 데이터가 들어있다. 이 데이터를 통해 여러 작업을 할 수 있다.

반응형