Este repositorio contiene una serie de laboratorios prácticos enfocados en la configuración de entornos y técnicas avanzadas de particionamiento de datos, optimización con Z-Order, y manejo de skew en datasets.
-
Lab1 - Configuración del Entorno
Este notebook cubre los pasos necesarios para configurar el entorno de trabajo, incluyendo las librerías y herramientas esenciales para trabajar con datasets a gran escala. -
Lab2 - Implementación de Particiones Avanzadas
En este laboratorio, se exploran técnicas de particionamiento avanzado que permiten mejorar el rendimiento de consultas en grandes conjuntos de datos. -
Lab3 - Carga de Dataset
Este laboratorio detalla los pasos para cargar datasets de manera óptima, incluyendo la preparación de datos y la organización adecuada para mejorar la eficiencia en procesos posteriores. -
Lab4 - Optimización de Particiones con Z-Order y Manejo de Skew
En este último laboratorio, se implementan técnicas de optimización de particiones como Z-Order y estrategias para manejar skew, mejorando el tiempo de consulta en grandes volúmenes de datos.
- Python 3.8 o superior
- Librerías especificadas en cada notebook (consultar la sección de instalación en cada uno)
Cada laboratorio está contenido en un notebook independiente. Se recomienda seguir el orden numerado para una comprensión gradual y secuencial de las técnicas y configuraciones aplicadas en cada uno.