'캐글경진대회' 태그의 글 목록

캐글경진대회

2020. 4. 5. 15:53

1. 데이터 이해(탐색적 데이터 분석 EDA)

2. 평가 척도 이해

3. 교차 검증 기법 선정

4. 피처 엔지니어링

변수값 스케일링, 이상값 제거, 결측값 대체, 범주형 데이터 변환, 변수 선정, 파생 변수 생성 등 주어진 데이터를 머신러닝 모델이 학습하기 쉽게 만듦
- 피처 엔지니어링은 Tabular 데이터 기반 경진대회의 랭킹을 가르는 가장 중요한 요인이며, 딥러닝 기반 경진대회에서는 모델 엔지니이어링이 핵심. (Tabluar Data는 테이블 기반의 데이터를 의미)

5. 모델 튜닝

6. 앙상블

[머신러닝 이론] 서포트 벡터 머신(Support Vector Machine) (0)	2020.04.12
[딥러닝 이론] 최적화 문제 (0)	2020.04.12
캐글 경진대회 유형 (0)	2020.04.05
딥러닝 라이브러리 목록 (0)	2020.04.05
[머신러닝 이론] 차원 축소(PCA) (0)	2020.03.10

2020. 4. 5. 15:21

분류	내용
피처드 (Featured)	외부 기업과 캐글이 연계해서 진행되는 상금과 캐글 포인트가 할당되는 일반적인 경진대회
입문자용 (Getting Started)	머신러닝 입문자를 위한 예제 기반 학습용 경진대회. 상금과 캐글 포인트는 할당되지 않는다.
연구 (Research)	연구 목적으로 진행되는 경진대회. 피처드 대비 적은 양의 상금이 할당된다.
놀이터 (Playground)	캐글이 직접 주최하는 경진대회. 상금이 할당되는 경우도 있다.
채용 (Recruitment)	채용을 목적으로 진행되는 경진대회. 상금 대시 채용 면접권을 얻을 수 있으며, 캐글 포인트도 할당된다.

캐글의 경우 수 많은 온라인 머신러닝 경진대회 플랫폼 중 하나이며, 2017년 3월 구글에 인수되었다.

현재 가장 영향력 있는 경진대회 플랫폼으로 거듭났지만 DrivenData, CrowdAnalytics, CodaLab, KDD 등 다양한 경진대회 플랫폼도 존재한다.

국내 플랫폼은 존재하지 않으나 한국정보화진흥원과 한국빅데이터협회가 매년 주최하는 빅콘테스트가 있다.

PREV 1 NEXT