Данные проекты были выполнены в ходе обучения в Яндекс.Практикуме, профессии "Аналитик данных" / "Специалист по Data Science".
| Название проекта | Описание | Используемые библиотеки |
|---|---|---|
| Исследование данных сервиса “Яндекс.Музыка” — сравнение пользователей двух городов | Сравнение предпочтений пользователей Яндекс.Музыки из Москвы и Санкт-Петербурга в зависимости от времени (утро и вечер) и дня недели (понедельник, среда, пятница) | Python, Pandas |
| Исследование надёжности заёмщиков — анализ банковских данных | На основе статистики о платёжеспособности клиентов исследовать влияет ли семейное положение и количество детей клиента на факт возврата кредита в срок | Python, Pandas |
| Продажа квартир в Санкт-Петербурге — анализ рынка недвижимости | Используя данные сервиса Яндекс.Недвижимость, определить рыночную стоимость объектов недвижимости и типичные параметры квартир | Python, Pandas, Matplotlib |
| Определение выгодного тарифа для телеком компании | На основе данных клиентов оператора сотовой связи проанализировать поведение клиентов и поиск оптимального тарифа | Python, Pandas, Matplotlib, NumPy, SciPy |
| Анализ продажи компьютерных игр и выявлении популярного продукта | Выявить закономерности, определяющих коммерческую успешность игры | Python, Pandas, NumPy, Matplotlib, SciPy, Seaborn |
| Классификаиция клиентов телеком компании | На основе данных предложить клиенту тариф | Python, Pandas, Matplotlib, Scikit-learn |
| Прогнозирование оттока клиентов Банка | На основе данных из банка определить клиента, который может уйти | Python, Pandas, Matplotlib, Scikit-learn |
| Определение наиболее выгодного региона нефтедобычи | На основе данных геологической разведки выбрать район добычи нефти | Pandas, Scikit-learn, бутстреп |
| Исследование технологического процесса очистки золота | Спрогнозировать концентрацию золота при проведении процесса очистки золота | Python, Pandas, Scikit-learn, Matplotlib, NumPy |
| Защита данных клиентов страховой компании | Разработка модели анонимизации персональных данных | Python, NumPy, Scikit-learn |
| Построение модели определения стоимости автомобиля | Разработка системы рекомендации стоимости автомобиля на основе его описания | Python, Pandas, LightGBM |
| Прогнозирование количества заказов такси на следующий час | Разработка системы предсказания объема заказа | Python, Pandas, Scikit-learn, statsmodels |
| Обучение модели классификации комментариев | Определение токсичности комментариев | Python, Pandas, BERT, nltk, tf-idf |
| Обработка фотографий покупателя | Определение возраста по фотографии | Python, Keras |
| Дипломный проект: Прогнозирование оттока клиентов телекоммуникационной компании | Прогнозирование оттока телеком компании | Python, Pandas, LightGBM, CatBoost, Matplotlib, Scikit-learn |