- En este proyectose desarollo Transformaciones,Desarrollo API,Deployment,Análisis exploratorio de los datos,Sistema de recomendación.
- Simulación de un equipo de data empresarial donde el área de análisis de datos le solicita al de Data engineering que, utilizando un grupo de datasets provistos, realice las transformaciones requeridas y posteriormente ponga a disposición los datos mediante la elaboración y ejecución de una API
- Data engineer 👩💻
pip install requirements.txt
- Inputamos los valores faltantes en rating .
- Modificamos los formatos de las fechas para poder ser cargada a una BD.
- Normalizamos el contenido del dataframe .
- Modificamos las columnas del dataframe en duration_int y duration_unit
- Se creo una funcion nos permite hallar la pelicula con mayor duracion.
- Se creo funcion nos trae el total de peliculas que tiene mayor score
- Se creo una funcion que nos trae la cantidad de pelicuclas segun la plataforma.
- Se creo funcion que nos trae el actor que mas aparece en una plataforma.
- Se creo una funcion devuelve la cantidada de contenidos.
- Se imlemento el algoritmo de recomendacion en la API.
- Se analizaron losvalores faltantes por colunas y por caso individual.
- se crearon funciones pra poder agilizar la deteccion de valores nulos .
- Se analizo el rating promedio por plataforma .
- Se detectaron aula
- Se implemento Filtro basado en contenido
- Se implemento un algoritmo TF-IDF de sklearn
- pandas ,numpy ,seaborn,matplotlib ,fast Api ,github,a