Задание: предсказать дебит нефти на нескольких скважинах на основе различных показателей со скважин.
Особенности:
- Данные представляли из себя временные ряды;
- Каждая скважина имела множество пропусков в данных, причем для каждый скважины они были индивидуальные;
- Было принято решение работать только с теми показателями, информация о которых имелась в более, чем 50% моментов времени, пропуски были линейно интерполированы.
Было проведено несколько эксперементов, и выбрана авторегрессионная модель на основе CatBoost и Skforecast для автоматического построения признакого пространства и оптимизации модели.
Подбор гиперпараметров осуществлялся с помощью GrivSearch.
В качестве baseline модели также был протестирован RandomForest.
Финальный ноутбук с построением предсказаний
Был использован "пророк" от Facebook для предсказывания верменного ряда. С начала были предсказаны экзогенные переменные, а далее на основе предсказанных данных, была предсказана целевая метрика.