This project develops a time series forecasting model for Sweet Lift Taxi to accurately predict taxi demand at airports during the next hour. This will enable better anticipation of demand and more efficient driver allocation, enhancing customer satisfaction and operational efficiency. The model's success will be measured by its ability to meet a specified error threshold in demand prediction.
Highlights: pandas, numpy, math, statsmodels, train_test_split, mean_squared_error, time, seasonal_decompose, matplotlib, LinearRegression, RandomForestRegressor, lightgbm, LGBMRegressor, data preprocessing, feature engineering, model selection, model evaluation, time series analysis, machine learning, data science
To install the project from GitHub, follow these steps:
- Clone the repository:
git clone https://github.com/Lani-Dom/Time_Series.git
- Navigate to the project directory:
cd Time_Series
- Install dependencies using the
Requirements.txt
file. - Open the Jupyter Notebook to explore and execute the code.
- Utilize the datasets folder to access the data used in the project.
*This project was created by Lani Domínguez (Product Designer and Data Scientist) during TripleTen Academy's Data Science bootcamp.
Este proyecto desarrolla un modelo de pronóstico de series temporales para Sweet Lift Taxi, con el objetivo de predecir con precisión la demanda de taxis en aeropuertos durante la próxima hora. Esto permitirá anticipar la demanda y asignar conductores de manera más eficiente, mejorando la satisfacción del cliente y la eficiencia operativa. El éxito del modelo se medirá por su capacidad para cumplir con un umbral de error especificado en la predicción de la demanda.
Características destacadas: pandas, numpy, math, statsmodels, train_test_split, mean_squared_error, time, seasonal_decompose, matplotlib, LinearRegression, RandomForestRegressor, lightgbm, LGBMRegressor, preprocesamiento de datos, ingeniería de características, selección de modelos, evaluación de modelos, análisis de series de tiempo, modelos de regresión, aprendizaje automático, ciencia de datos.
Para instalar el proyecto desde GitHub, sigue estos pasos:
- Clona el repositorio:
git clone https://github.com/Lani-Dom/Time_Series.git
- Navega al directorio del proyecto:
cd Time_Series
- Instala las dependencias utilizando el archivo
Requirements.txt
. - Abre el Jupyter Notebook para explorar y ejecutar el código.
- Utiliza la carpeta de datasets para acceder a los datos utilizados en el proyecto.
*Este proyecto fue creado por Lani Domínguez (Product Designer y Data Scientist) durante el bootcamp de Ciencia de Datos de TripleTen Academy.