-
Light GBM은 2014년 3월에 나온 XGBoost 알고리즘 이후, 2017년 1월에 발표된 알고리즘이다. GBM은 가지가 1번 분리될 때 2개씩 매번 분리가 되서 overfitting이 잘 일어난다. 하지만 LightGBM은 가지가 1번 분리(2개의 node 생성)될 때 모든 가지를 분리하지 않고 2개의 node 중 잘 맞는 node 기준으로만 나눈다. 전체적인 아키텍처는 다음과 같다.
2018/06/25
-
caret패키지를 사용한 CatBoost 튜닝 v0.01 (random grid search)
2018/06/17
-
새로운 머신러닝 알고리즘 CatBoost가 등장했습니다. 러시아 과학자가 개발한 CatBoost는 Tree Boosting 계열의 최신 머신러닝 알고리즘 입니다. 최근 들어 Tree Boosting 계열의 머신러닝 알고리즘이 활발하게 연구되고 있습니다. 이는 아마도 XGBoost가 캐글 대회에서 수차례 winning solution으로 검증되면서 많은 과학자들이 XGBoost와 같은 Tree Boosting 머신러닝 기법에 많은 관심을 갖고 있는 것 같습니다.
2018/06/16
-
추천 R패키지 속도 및 성능 비교 연구 결과입니다.
데이터셋 : MovieLense (100만행)
컴퓨터 사양 : 7i, 32Gb RAM
2018/06/14
-
Yandex 가 2017년 6월에 논문 CatBoost: unbiased boosting with categorical features에서 소개한 방법이다. CatBoost는 “Categorical Boost” 약자로, 이름에서부터 범주형 변수를 위한 Boosting 방법이라는 냄새를 풍기고 있다.
2018/06/14