Проекты выполненные в рамках обучающего курса Яндекс.Практикум специализации Data Scientist.
№ | Название проекта | Краткое описание | Инструменты |
1 | Яндекс.Музыка | Исследование поведения пользователей Яндекс.Музыки двух столиц. |
pandas
|
2 | Исследование объявлений о продаже квартир | На основании данных сервиса Яндекс.Недвижимость определить рыночную стоимость объектов недвижимости и установить параметры, которые помогут отследить аномалии и мошенническую деятельность. |
pandas , matplotlib , seaborn
|
3 | Определение перспективного тарифа для телеком-компании | Исследование поведения клиентов, на основании предварительного анализа тарифов на небольшой выборке клиентов, и выявление лучшего тарифа для определенной категории клиентов. |
pandas , matplotlib , numpy , scipy
|
4 | Сборный проект. Продажа игр. | Исследование продажи игр по всему миру с целью выявить определяющие успешность игры закономерности. |
pandas , matplotlib , numpy , scipy , seaborn
|
5 | Рекомендация тарифов | Построение модели для задачи классификации, которая способна проанализировать поведение клиентов и предложить пользователям новый тариф. |
pandas , matplotlib , numpy , seaborn , scikit-learn , catboost
|
6 |
Отток клиентов |
Построение модели прогноза оттока клиентов из банка. |
pandas , matplotlib , numpy , seaborn , scikit-learn
|
7 | Выбор локации для скважины | Построение модели машинного обучения, которая поможет определить регион, где добыча принесёт наибольшую прибыль. Анализ возможной прибыль и риски техникой Bootstrap. |
pandas , matplotlib , numpy , seaborn , scikit-learn
|
8 | Восстановление золота из руды | Построение модели, которая должна предсказать коэффициент восстановления золота из золотосодержащей руды. Модель поможет оптимизировать производство, чтобы не запускать предприятие с убыточными характеристиками. |
pandas , matplotlib , numpy , seaborn , scikit-learn
|
9 |
Защита персональных данных клиентов |
Разработка метода преобразования данных, чтобы по ним было сложно восстановить персональную информацию. |
pandas , matplotlib , numpy , scikit-learn
|
10 | Определение стоимости автомобилей | Построение модели для быстрого определения стоимости автомобилей |
pandas , matplotlib , numpy , scikit-learn , seaborn , catboost , xgboost , lightgbm
|
11 | Прогнозирование количество заказов такси | Построение модели прогнозирования количества заказов такси на следующий час, чтобы привлекать больше водителей в период пиковой нагрузки. |
pandas , matplotlib , numpy , scikit-learn , seaborn , catboost , xgboost , lightgbm
|
12 | Проект для «Викишоп». Поиск токсичных комментариев. | Построение модели NLP для поиска токсичных комментарии и отправки их на модерацию |
pandas , matplotlib , numpy , scikit-learn , seaborn , NLTK , re , catboost , xgboost , lightgbm
|
13 | Определение по фотографии возраста ппокупателей | Построение модели, которая по фотографии определит приблизительный возраст человека. |
pandas , matplotlib , numpy , seaborn , keras
|
14 |
Определение выгодного тарифа для телеком компании |
На основе данных клиентов оператора сотовой связи проанализировать поведение клиентов и поиск оптимального тарифа |
Python, Pandas, Matplotlib, numpy, SciPy, описательная статистика, проверка статистических гипотез, math, Seaborn, sklearn, машинное обучение
|