Algunas personas piensan que el aprendizaje no supervisado es aburrido porque no hay un resultado específico que predecir o evaluar. Otras personas, especialmente los expertos en aprendizaje automático, consideran el aprendizaje no supervisado como el futuro de la ciencia de datos porque se asemeja a cómo aprenden los seres humanos. Piensa en cómo un niño aprende lo que es un perro. Papá y mamá no le muestran 100,000 animales y le dicen cuáles son perros. Más bien, el niño seguirá encontrando perros en su experiencia diaria y, después de varios encuentros, extraerá las características comunes de los perros y reconocerá otros nuevos.
En el aprendizaje no supervisado, la tarea clásica es el análisis de conglomerados, en la que encuentras patrones ocultos o grupos en los datos. La mayoría de las veces, las tareas de aprendizaje no supervisado son abiertas y necesitarás dar sentido a los datos sin ningún camino claramente definido. Pero si sigues entrenándote y eventualmente te vuelves bueno encontrando caminos de la nada, te convertirás en un científico de datos establecido. Esta es la razón por la cual debes tomar en serio el aprendizaje no supervisado.
En este laboratorio, te presentaremos un problema de aprendizaje no supervisado sin objetivos claramente definidos. Tu objetivo general es agrupar los datos y ver si puedes extraer ideas útiles. Pero, por supuesto, te proporcionaremos las instrucciones necesarias para ayudarte a comenzar.
Abre el archivo main-esp.ipynb
en el directorio your-code
. Sigue las instrucciones y agrega tu código y explicaciones según sea necesario. Al final de este laboratorio, habrás aprendido cómo preparar un conjunto de datos para la mayoría de los algoritmos de scikit-learn.
main-esp.ipynb
con tus respuestas.
Al finalizar, agrega tus entregables a git. Luego haz commit y push de tu rama al repositorio remoto.