kaggel 이란?
캐글은 2010년 설립된 예측모델 및 분석 대회 플랫폼이다. 기업 및 단체에서 데이터와 해결과제를 등록하면, 데이터 과학자들이 이를 해결하는 모델을 개발하고 경쟁한다.
해당 사이트의 주소이다.
자주 쓰는 카테고리 설명
옆에를 보면 카테고리가 있다. 하나씩 간단하게 설명하면
# Compete
compete에서는 지금 현재 상금을 걸고 대회를 하고 있는 것들이 있다. 여기에는 기업에서 어떠한 문제를 해결하기 위해 데이터를 주고 상금을 걸어 competitions을 한다.
# Data
여기에는 다양한 데이터 셋이 있다. 이 데이터셋을 통해 머신러닝이나 딥러닝을 할 수 있다. 여기서 원하는 데이터를 얻을 수 있다.
# Notebook
Notebook 에서는 사람들이 데이터를 가지고 작업을 한 것을 볼 수 있다. jupyter 같은 느낌이라고 보면 된다. 여기서 남들이 어떻게 했는지 내 거와 비교하면서 공부할 수 있다.
보통 이정도를 주요하게 많이 쓴다.
데이터셋 보기
해당 competitions이나 dataset을 들어가면
이런 창으로 이어진다. 여기서 data를 누르면
이렇게 데어서 셋이 나오고 이것을 다운로드할 수 있다. 또한 데이터에 대한 간단한 설명까지 볼 수 있다.
# 다른 사람의 Notebooks
Data라는 부분 옆에 Notebooks이라는 것을 누르면 사람들이 해당 데이터 셋에 대해 올린 Notebook이 있다. 남들이 한 것을 통해 참고할 수도 있고 내 것과 비교할 수도 있다.
# Notebook 작성
해당 버튼을 클릭하면 아래와 같은 창으로 이동한다.
여기서 해당 Notebook으로 Create를 하게 되면
이런 창으로 넘어간다. 여기에는 데이터가 들어있다. 이 데이터를 통해 여러 작업을 할 수 있다.
'Data scientist > kaggle' 카테고리의 다른 글
[kaggle] house prise 를 통한 회귀분석(regression analysis) - 1 (데이터 탐색적 분석) (0) | 2020.10.23 |
---|