sandbox_challenge

Предсказание прогноза отклика аудитории на интернет-опрос

Метрика: ROC-AUC

Получил На лидерборде песочницы скор:

П: 0.7458305
4 / 15
Ф: 0.7447829
4 / 15

На решение потратил примерно около трех вечеров -- причем один из вечеров был уделен чисто предобработке данных.

Структура:

preparing -- предобработка данных (tf-idf и countvectorizer)
baseline -- просто логрег в качестве бейзлайна
lgbm_folds -- усреднение предсказания градиентного бустинга на 10 фолдах
features -- добавил еще численных фич к имеющимся sparse-матрицам
lgbm_folds_with_numeric -- градиентный бустинг на 10 фолдах по расширенному датасету с новыми фичами

Отдельно еще делал EDA, гридсерч для подбора гиперпараметров для LGBM, пробовал разные векторайзеры для sparse фич

Финальный предикт: блединг `logreg0.05 + lgbm_10_folds0.95`

Есть куда еще улучшать: Покрутить гиперпараметры, сделать еще несколько независимых разных моделей для блендинга (например, обучить еще xgboost и catboost, плюс обучить модель на данных, на которых попробовать уменьшить размерность или кластеризовать), Можно еще попробовать многоуровневый стекинг.

Также можно подумать и добавить ещё статистических фичей из исходных данных, а для категориальной фичи попробовать впилить таргет энкодинг.

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
.gitignore		.gitignore
README.md		README.md
baseline.ipynb		baseline.ipynb
features.ipynb		features.ipynb
lgbm_folds.ipynb		lgbm_folds.ipynb
lgbm_folds_with_numeric.ipynb		lgbm_folds_with_numeric.ipynb
meme.png		meme.png
preparing.ipynb		preparing.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

sandbox_challenge

Предсказание прогноза отклика аудитории на интернет-опрос

Метрика: ROC-AUC

Получил На лидерборде песочницы скор:

Структура:

Финальный предикт: блединг `logreg0.05 + lgbm_10_folds0.95`

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

sandbox_challenge

Предсказание прогноза отклика аудитории на интернет-опрос

Метрика: ROC-AUC

Получил На лидерборде песочницы скор:

Структура:

Финальный предикт: блединг logreg*0.05 + lgbm_10_folds*0.95

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Финальный предикт: блединг `logreg0.05 + lgbm_10_folds0.95`

Packages