Olá pessoal, Como informado em sala de aula, a atividade de nota da unidade 1 não precisará de apresentação.
A data para finalização será 1 semana após o fim do caderno que iniciamos na última aula, que estimo terminar esta semana.
A atividade 1 consistirá no envio do link de uma pasta compartilhada no google drive ou um repositório no github contendo:
- Datasets e todos os artefatos utilizados;
- Cadernos jupyter com o processo aplicado em uma pipeline de PLN até o momento anterior ao treinamento do modelo (coleta, limpeza, preprocessamento, extração de features).
O caderno deverá primar pela qualidade, incluindo:
- Análise exploratória de dados
- Storytelling
- Explicação detalhada de cada etapa
As células devem estar EXECUTADAS, com a saída registrada no caderno.
A atividade 2 envolverá a modelagem e avaliação dos modelos, logo, será a continuidade deste trabalho. Na atividade 2, haverá a apresentação coletiva da solução integral em sala de aula em data a ser definida.
O objetivo, ao final, é que vocês tenham executado uma pipeline integral de NLP para resolver algum dos tipos de problemas que foram apresentados em sala de aula em um dataset livremente escolhido por vocês.
A atividade será avaliada pela qualidade técnica e esmero na construção do caderno.