Pull to refresh

Comments 6

Первая идея по улучшению: если метрика - это цифра с открытого лидерборда на каггле, то следует поработать над повышением надежности модели и над надежным расчетом метрики, а не над подгонкой модели под лидерборд.

Добрый день!

Итоговый скор и место в лидерборде рассчитывается по метрике accuracy.

Работа, которую я проделал, была направлена на улучшение этой метрики путем предобработки данных и подбора гиперпараметров на валидационной выборке.

Если используете catboost, то зачем кодируете категориальные признаки? Библиотека ведь поэтому так и называется :)

Добрый день! Спасибо за ваш комментарий.

В процессе решения задачи тестировал различные модели, в том числе линейные, в которых использовал кодирование и не убрал из итогового варианта поста.

 

P.S.: Отличное замечание, так как one-hot кодирование в случае с Сatboost может негативно
повлиять на время обучения и результат.

Sign up to leave a comment.

Articles