Skip to content

TeachingTextMining/TextClassification

Folders and files

NameName
Last commit message
Last commit date

Latest commit

8283510 · Mar 7, 2025
Mar 18, 2021
Jan 31, 2023
Feb 17, 2023
Mar 6, 2024
Mar 12, 2024
Mar 16, 2024
Feb 29, 2024
Mar 7, 2025
Mar 6, 2024
May 5, 2021
Apr 14, 2021
Apr 15, 2021

Repository files navigation

TextClassification

Repositorio de cuadernos Jupyter Notebook para mostrar diferentes casos de Máquinas de Aprendizaje de cómo tratar el problema de Clasificación Textual. Siguiendo la enumeración 01 hasta 06, los cuadernos muestran una evolución en la complejidad al tratar el problema, y finalmente la simplificación de esta con el uso de AutoML.

  • 01-SA-Pipeline: Describe la construcción, entrenamiento y aplicación de predicción, por etapas, de un pipeline utilizando algoritmos tradicionales como SVM, Arboles de Decisión, y Regresión Lineal.
  • 02-SA-Transformers-Basic: Introduce el uso de la librería Transfomers en particular el uso de modelos listos para ser utilizados.
  • 03-SA-Transformers-Training-FineTuning: Describe, con la librería Transformers, cómo realizar un reentrenamiento de modelos pre-entrenados para ajustarlos a un problema concreto.
  • 04-SA-Transformers-Training-Custom: Describe, con la librería Transformers, cómo extraer características de un modelo Trasformer y de otras técnicas complementarias. Este vector personalizado de características servirá para reentrenar el modelo Transformers.
  • 05-SA-Ensemble: Describe, con la librería Transformers y Sklearn, cómo crear un meta-algoritmo que tome decisiones entre las propuestas de clasificación de varios clasificadores.
  • 06-SA-AutoGOAL: Describe, con la librería AutoGOAL de autoML, cómo crear un buscador de Pipeline optimizados para un problema de clasificación textual. Se proporcionan dos variantes: 1) extrayendo manualmente las características que alimentan al Pipeline; 2) Alimentar al Pipeline con texto plano y la elección de pre-procesamiento de datos la elige el sistema.

Contacts:

Yoan Gutiérrez <ygutierrez[📧]dlsi.ua.es>

José Ignacio Abreu Salas <ji.abreu[📧]ua.es>

License

MIT License

How to cite