Skip to content

Latest commit

 

History

History
29 lines (16 loc) · 1.35 KB

requirements.md

File metadata and controls

29 lines (16 loc) · 1.35 KB

Olá pessoal, Como informado em sala de aula, a atividade de nota da unidade 1 não precisará de apresentação.

A data para finalização será 1 semana após o fim do caderno que iniciamos na última aula, que estimo terminar esta semana.

A atividade 1 consistirá no envio do link de uma pasta compartilhada no google drive ou um repositório no github contendo:

  1. Datasets e todos os artefatos utilizados;
  2. Cadernos jupyter com o processo aplicado em uma pipeline de PLN até o momento anterior ao treinamento do modelo (coleta, limpeza, preprocessamento, extração de features).

O caderno deverá primar pela qualidade, incluindo:

  1. Análise exploratória de dados
  2. Storytelling
  3. Explicação detalhada de cada etapa

As células devem estar EXECUTADAS, com a saída registrada no caderno.

A atividade 2 envolverá a modelagem e avaliação dos modelos, logo, será a continuidade deste trabalho. Na atividade 2, haverá a apresentação coletiva da solução integral em sala de aula em data a ser definida.

O objetivo, ao final, é que vocês tenham executado uma pipeline integral de NLP para resolver algum dos tipos de problemas que foram apresentados em sala de aula em um dataset livremente escolhido por vocês.

A atividade será avaliada pela qualidade técnica e esmero na construção do caderno.