Итоговый проект по дисциплине «Программирование на Python», онлайн-магистратура МФТИ «Науки о данных», 1 семестр
Дано: база резюме, выгруженная с сайта поиска вакансий hh.ru. Часть соискателей не указывает желаемую заработную плату, когда составляет своё резюме. Имеющиеся данные необходимо преобразовать, исследовать и очистить, чтобы подготовить их для построения модели предсказания подходящего пользователю уровня зарплаты.
- Базовый анализ структуры данных
- Преобразование данных
- Разведывательный анализ
- Очистка данных
Исходные данные для проекта можно загрузить по ссылке (Яндекс Диск).
К сожалению, github не поддерживает отображение в ноутбуках интерактивных графиков, сделанных с помощью plotly.express. Все выполненные графики доступны в виде html-файлов с сохранением интерактивности в папке plotly, для просмотра их придется скачать.
В сам ноутбук были добавлены jpg-версии графиков: это статичное, менее информативное (и не такое красивое) представление, приведенное исключительно для предварительного просмотра.