Skip to content

alemcuevas/DatabricksPartitions

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Proyecto de Laboratorios de Particionamiento y Optimización de Datos

Este repositorio contiene una serie de laboratorios prácticos enfocados en la configuración de entornos y técnicas avanzadas de particionamiento de datos, optimización con Z-Order, y manejo de skew en datasets.

Contenido

  1. Lab1 - Configuración del Entorno
    Este notebook cubre los pasos necesarios para configurar el entorno de trabajo, incluyendo las librerías y herramientas esenciales para trabajar con datasets a gran escala.

  2. Lab2 - Implementación de Particiones Avanzadas
    En este laboratorio, se exploran técnicas de particionamiento avanzado que permiten mejorar el rendimiento de consultas en grandes conjuntos de datos.

  3. Lab3 - Carga de Dataset
    Este laboratorio detalla los pasos para cargar datasets de manera óptima, incluyendo la preparación de datos y la organización adecuada para mejorar la eficiencia en procesos posteriores.

  4. Lab4 - Optimización de Particiones con Z-Order y Manejo de Skew
    En este último laboratorio, se implementan técnicas de optimización de particiones como Z-Order y estrategias para manejar skew, mejorando el tiempo de consulta en grandes volúmenes de datos.

Requisitos

  • Python 3.8 o superior
  • Librerías especificadas en cada notebook (consultar la sección de instalación en cada uno)

Ejecución

Cada laboratorio está contenido en un notebook independiente. Se recomienda seguir el orden numerado para una comprensión gradual y secuencial de las técnicas y configuraciones aplicadas en cada uno.

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published