Deployed 9d10378 with MkDocs version: 1.5.2

ResidenciaTICBrisa · Oct 17, 2023 · 4213841 · 4213841
1 parent aedadd2
commit 4213841
Show file tree

Hide file tree

Showing 3 changed files with 80 additions and 21 deletions.
diff --git a/atividade/index.html b/atividade/index.html
@@ -605,6 +605,13 @@
     Relatório 17 – 02/10/2023 a 08/10/2023
   </a>
 
+</li>
+
+        <li class="md-nav__item">
+  <a href="#relatorio-18-09102023-a-15102023" class="md-nav__link">
+    Relatório 18 – 09/10/2023 a 15/10/2023
+  </a>
+
 </li>
 
     </ul>
@@ -756,6 +763,13 @@
     Relatório 17 – 02/10/2023 a 08/10/2023
   </a>
 
+</li>
+
+        <li class="md-nav__item">
+  <a href="#relatorio-18-09102023-a-15102023" class="md-nav__link">
+    Relatório 18 – 09/10/2023 a 15/10/2023
+  </a>
+
 </li>
 
     </ul>
@@ -2088,14 +2102,14 @@ <h3 id="relatorio-16-25092023-a-01102023">Relatório 16 – <strong>25/09/2023 a
 <p>29/09/2023
 <br>Versionamento do modelo com resolução dos testes do modelo, issue #42</p>
 <h3 id="relatorio-17-02102023-a-08102023">Relatório 17 – <strong>02/10/2023 a 08/10/2023</strong></h3>
-<p>Essa semana retoma a finalização das tarefas restantes, com prioridade no treinamento do modelo, na finalidade de procurar novos meios e ideias e aplicá-las para conclusão dessa etapa de classificação supervisionada, enfim, uma abordagem para novos métodos, inferir um modelo definitivo próximo da acurácia de 80%.</p>
-<p>O aumento da acurácia do modelo relatado na semana anterior, de 2% acima da versão anterior, resultou na ideia de melhorar balanceamento das categorias, dado por equilibrar as propostas, uma vez que sacrifica grande parte dos dados nos temas abundantes e incrementa as simuladas para os tópicos de baixa precisão, dessa maneira, aproxima o resultado do limiar sugerido pela equipe.</p>
-<p>Os testes no Set-Fit não atingiram a estimativa ideal para o seu uso, o recurso a ser utilizado para alternativa aos algoritmos preliminares, no resultado, abaixo do esperado, descritos nas análises realizadas, obteve acurácia entre 25% e 30%.</p>
-<p>Os membros restantes focaram em garantir que a documentação sobre o acoplamento do modelo ao sistema Ruby fosse encaminhada para o repositório, disponibilizando um parecer importante que fornece as equipes futuras informações para o desenvolvimento de outros projetos semelhantes.</p>
-<p>Em resumo, o mês de setembro baseou-se na integração do modelo ao sistema Ruby, do qual o site Brasil participativo foi implementado e as otimizações do classificador supervisionado (SLClassifier), parte importante para versionamento do modelo, atualização da arquitetura e documentação de desenvolvimento do produto. </p>
-<p>As primeiras semanas do mês destinaram-se para realização de pesquisas, estudos, leituras de recursos, a exploração de outros tipos modelos, adição de novos métodos na tentativa de aprimorar a acurácia do modelo. Todas as etapas foram revistas entre os membros da equipe, os professores, instrutores e cliente, validando as análises para o modelo. </p>
-<p>Sendo assim, com as tarefas alinhadas ao contexto, seguiu-se para as últimas semanas, com o acréscimo das propostas simuladas, versionamento e as documentações para o repositório. Além disso, obteve-se alguns avanços na fase de serialização com estudo e pesquisa do formato ONNX, implementação do sistema Ruby e criação da gem.</p>
-<p>Por outro lado, na fase de treinamento do modelo, os testes analisados, visando as novas versões das propostas simuladas e o Set-Fit, não atingiram resultados satisfatórios e estimados para acoplamento e seu definitivo término e atualização da versão na arquitetura do projeto, resultando em acurácias e precisões abaixo do limiar sugerido pelo grupo, no entanto, com a tendência de melhoramento, cálculos e requisitos, maior que as versões iniciais.</p>
+<p>Essa semana retoma o andamento das tarefas restantes, com prioridade no treinamento do modelo, na finalidade de procurar novos meios e ideias e aplicá-las para conclusão na etapa de classificação supervisionada, enfim, uma abordagem para novos métodos, próximo de um modelo definitivo com 80% de acurácia.</p>
+<p>O aumento da acurácia do modelo relatado na semana anterior, de 2% acima da versão anterior, resultou na ideia de melhorar balanceamento das categorias, dado por equilibrar as propostas, uma vez que sacrifica grande parte dos dados nos temas abundantes e incrementa mais para os tópicos de baixa precisão, afim de aproximar o resultado ao limiar sugerido pela equipe.</p>
+<p>Os testes no Set-Fit, alternativa aos algoritmos preliminares, não atingiram a pontuação ideal para sua devida utilização, no resultado, abaixo do esperado, descritos nas análises realizadas, obteve-se acurácia entre 25% e 30%.</p>
+<p>Os membros restantes focaram em garantir que a documentação sobre o acoplamento do modelo ao sistema Ruby fosse encaminhada para o repositório, disponibilizando um parecer importante para as equipes futuras fundamentadas em outros projetos semelhantes.</p>
+<p>Em resumo, o mês de setembro baseou-se na integração do modelo ao Ruby, sistema do qual o site Brasil participativo foi implementado. Além disso, foram feitas otimizações do classificador supervisionado (SLClassifier), versionamento do modelo, atualização da arquitetura e documentação de desenvolvimento do produto. </p>
+<p>As primeiras semanas do mês destinaram-se para realização de pesquisas, estudos, leituras de recursos, a exploração de outros tipos modelos, adição de novos métodos na tentativa de aprimorar a acurácia do modelo. Tarefas revistas entre os membros da equipe, professores, instrutores e cliente, validando as análises apresentadas. </p>
+<p>Sendo assim, com as tarefas alinhadas ao roteiro, seguiu-se para as últimas semanas, com o acréscimo das propostas simuladas, versionamento e as documentações para o repositório. Aliás, obteve-se alguns avanços na fase de serialização com estudo e pesquisa do formato ONNX, implementação do sistema Ruby e criação da gem.</p>
+<p>Por outro lado, na fase de treinamento do modelo, nos testes analisados, visando as novas versões das propostas simuladas e o Set-Fit, demonstraram resultados não satisfatórios e estimados para acoplamento e seu definitivo término do projeto, resultando em acurácias e precisões abaixo do limiar sugerido pelo grupo, porém, mostrando uma tendência de melhoramento e aumento nas apurações individuais dos tópicos, acima das versões iniciais.</p>
 <p><strong>Tarefas de setembro:</strong></p>
 <table>
 <thead>
@@ -2133,9 +2147,9 @@ <h3 id="relatorio-17-02102023-a-08102023">Relatório 17 – <strong>02/10/2023 a
 </tr>
 </tbody>
 </table>
-<p>Dito isso, durante a semana anterior, parte do roteiro planejado teve que ser adiado para a primeira semana de outubro e grande parte do progresso atual foi revisto para solucionar problemas, falhas de processamento em alguns testes, baixa estimativa na acurácia e falta de recursos suficientes para alcançar a meta desejada.</p>
-<p>Em relação, as dificuldades relatadas, está a demanda de processamento para execução dos treinamentos nos modelos, consequentemente, abrindo dúvidas sobre o tipo de equipamento que será utilizado na classificação quando acoplado ao Brasil Participativo e concluso o projeto e se o modelo implantado no Ruby, será público ou não.</p>
-<p>As tarefas de prioridade para outubro escritas no roteiro, tendem a fechar os requisitos da arquitetura do projeto, na busca de complementá-lo com o desenvolvimento de um classificador não supervisionado (UnSLClassifier), definitivamente, classificação em tópicos (subcategorias).</p>
+<p>Durante a semana anterior, parte do roteiro planejado teve que ser adiado para a primeira semana de outubro e grande parte do progresso atual foi revisto para solucionar problemas, falhas de processamento e falta de recursos suficientes para alcançar a meta desejada.</p>
+<p>Nas dificuldades relatadas, estão a demanda de processamento para execução dos treinamento, consequentemente, abrindo dúvidas sobre o tipo de equipamento que será utilizado na classificação quando finalizado o projeto e se o modelo implantado no Ruby, será público ou não.</p>
+<p>As tarefas de prioridade para outubro detalhadas no roteiro, tendem a fechar os requisitos estruturação do projeto, na busca de complementá-lo com o desenvolvimento do classificador não supervisionado (UnSLClassifier).</p>
 <p><strong>Resumo das tarefas para outubro:</strong></p>
 <table>
 <thead>
@@ -2161,17 +2175,62 @@ <h3 id="relatorio-17-02102023-a-08102023">Relatório 17 – <strong>02/10/2023 a
 </tr>
 </tbody>
 </table>
-<p>Nesta pequena tabela, com a compressão simplificada dos fatos, edita grande parte do roteiro original de 4 semanas de outubro. Sendo que, a primeira e segunda semana de outubro, designa para maioria dos membros o estudo de algoritmos de clusterização e exploração de benchmarks. A penúltima e última semana, partem do princípio empírico de teste e conclusão, com análises e resultados dos algoritmos selecionados aplicados ao benchmark, portanto, com o envio da documentação no repositório, juntamente, com os registros semanais.</p>
+<p>Nesta pequena tabela, com a compressão simplificada dos fatos, edita grande parte do roteiro original de 4 semanas de outubro. Sendo que, a primeira e segunda semana de outubro, designa para maioria dos membros o estudo de algoritmos de clusterização e exploração de benchmarks. A penúltima e última semana, partem do princípio empírico de teste e conclusão, com análises e resultados dos algoritmos selecionados aplicados ao benchmark, com o envio da documentação no repositório, juntamente, com os registros semanais.</p>
 <p><strong>Atividades da semana:</strong>
-<br>As tarefas foram finalizadas no decorrer dessa semana, sendo que somente a tarefa de classificação ainda não foi concluída. Desse modo, ela foi discutida pelos instrutores e a equipe, para readequação das prioridades do roteiro, dado o pouco tempo disponível, visto que, a demanda pela acurácia e precisão dentro dos requisitos escolhidos pelo time, serve de cerne para arquitetura do projeto e finalização no desenvolvimento do produto. Sem sua inferência desejada, encerra a possibilidade de inteirar o objetivo principal, de classificar as propostas e escaloná-las para referências semelhantes, por exemplo, a vista na casa legislativa, no ato de integrar as medidas pela maioria de votos estipulada em conjunto ao ministério público e demais interessados.</p>
-<p>Embora, superado o prazo de entrega das tarefas, não se afasta a conclusão de novas tarefas programas no roteiro, previsto para iniciarem na segunda semana de outubro, uma vez que o mero atraso propõe visões diferentes e abertura de novos estudos, portanto, traz a importância para exploração teórica e prática de entendimento geral alinhado ao princípio educativo do projeto e apresentação do produto para os demais integrantes.</p>
+<br>As tarefas foram finalizadas no decorrer dessa semana, sendo que somente a tarefa de classificação está atrasada. Desse modo, ela foi discutida pelos instrutores e a equipe, para readequação das prioridades do roteiro, dado ao pouco tempo disponível.</p>
+<p>A demanda pela acurácia e precisão dentro dos requisitos escolhidos pelo time, serve de cerne para arquitetura do projeto e finalização no desenvolvimento do produto. Sem sua inferência desejada, encerra a possibilidade de inteirar o objetivo principal, de classificar as propostas e escaloná-las em referências semelhantes, por exemplo, na casa legislativa, que convoca medidas e propostas, votados pela maioria de pessoas, transformando-as em projeto de lei em conjunto com a câmara e demais representantes.</p>
+<p>Embora, superado o prazo de entrega, não se afasta a conclusão de novas tarefas programas no roteiro, previsto para iniciarem na segunda semana de outubro, uma vez que o mero atraso propõe visões diferentes e abertura de novos estudos, portanto, ha uma importância na exploração teórica e prática de entendimento geral alinhado ao princípio educativo do projeto.</p>
 <p>Os demais detalhamentos ressumem-se ao histórico supracitado deste relatório.</p>
 <p>02/10/2023
 <br>Finalizado os testes e otimizações do Set-Fit, issue #36.</p>
 <p>04/10/2023
 <br>Encaminhado o relatório semanal, registro 16 para o repositório na aba “Registro de atividades”. Encerrado os registros de setembro.</p>
 <p>08/10/2023
 <br>Adicionado uma nova versão do modelo, model_v6 #42.</p>
+<h3 id="relatorio-18-09102023-a-15102023">Relatório 18 – <strong>09/10/2023 a 15/10/2023</strong></h3>
+<p>De acordo com roteiro, essa semana foi dedicada para pesquisa e estudo de algoritmos de clusterização e novas metodologias para serem aplicadas para o aprendizado não supervisionado. Além disso, foi incluído novos versionamentos de modelo ao repositório, juntamente com as documentações que retratam as novas apurações recolhidas em um novo experimento utilizado pelos responsáveis para balancear as propostas nos tópicos.</p>
+<p>Logo na segunda feira, a equipe designada para o treinamento do modelo, explorou diversos artigos que pudessem de alguma forma melhorar sua pontuação, visto que em semanas anteriores, tiveram um pequeno aumento nos resultados obtidos, sendo ligeiramente maiores com a adição de propostas simuladas aos tópicos de pouco desempenho. Desse modo, foi elaborado estudos partindo desse ponto, da última versão do modelo, com intuito de descobrir formas de resolver os problemas supracitados em análises anteriores.</p>
+<p>Seguindo esse contexto, foram encaminhadas novas versões do modelo na semana. A última versão anexada mostra algumas alterações, principalmente na etapa de pré-processamento, refletidas nos estudos realizados e eventualmente, a utilização de uma técnica para simulação de dados. No resultado, obteve-se melhoria nas pontuações individuais de 3 dos 6 tópicos problemáticos.</p>
+<p>No decorrer dessa semana, novos algoritmos de clusterização foram explorados pela equipe, iniciando as tarefas de outubro. A pesquisa foi baseada em um mapa disponibilizado no site do scikit-learn.</p>
+<p>Em resumo, o conteúdo estudado envolve KMeans, Latent Dirichlet Allocation (LDA), MeanShift e VBGMM, fundamentado na quantidade de dados disponibilizados em relação ao número de tópicos para predição do modelo, em virtude da informação no mapa. Os artigos serão acrescentados nas respectivas pastas ao repositório para próxima semana.</p>
+<p><strong>Tarefas de outubro:</strong></p>
+<table>
+<thead>
+<tr>
+<th>Membros da Equipe</th>
+<th>Tarefas</th>
+<th>Período</th>
+<th>Status</th>
+</tr>
+</thead>
+<tbody>
+<tr>
+<td>Chaydson e Alexandre</td>
+<td>UnSLClassifier v1.0.0</td>
+<td>09/10 - 30/10</td>
+<td>INICIADO</td>
+</tr>
+<tr>
+<td>Leandro Santos</td>
+<td>Registro de atividades semanais</td>
+<td>09/10 - 05/11</td>
+<td>INICIADO</td>
+</tr>
+<tr>
+<td>João Pedro e Leandro Silva</td>
+<td>SLClassifier v1.0.0</td>
+<td>04/09</td>
+<td>EM ANDAMENTO</td>
+</tr>
+</tbody>
+</table>
+<p>Houve uma pequena mudança nas designações de tarefas por equipe, separou-se os demais membros para equilibrar o fluxo de trabalho, em razão da tarefa de classificação supervisionada não ser finalizada no mês passado, com prioridade alta.</p>
+<p><strong>Atividades da semana:</strong>
+<br>Os detalhamentos resumem-se ao parecer dessa semana.</p>
+<p>11/10/2023
+<br>Encaminhado o relatório semanal, registro 17 para o repositório na aba “Registro de atividades”. </p>
+<p>15/10/2023
+<br>Encaminhado a versão 9 do modelo para o repositório. #42</p>
 
 
 

diff --git a/sitemap.xml b/sitemap.xml
@@ -2,37 +2,37 @@
 <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
     <url>
          <loc>https://ResidenciaTICBrisa.github.io/07_ProcessamentoLinguagemNatural/</loc>
-         <lastmod>2023-10-11</lastmod>
+         <lastmod>2023-10-17</lastmod>
          <changefreq>daily</changefreq>
     </url>
     <url>
          <loc>https://ResidenciaTICBrisa.github.io/07_ProcessamentoLinguagemNatural/atividade/</loc>
-         <lastmod>2023-10-11</lastmod>
+         <lastmod>2023-10-17</lastmod>
          <changefreq>daily</changefreq>
     </url>
     <url>
          <loc>https://ResidenciaTICBrisa.github.io/07_ProcessamentoLinguagemNatural/processo_de_desenvolvimento/</loc>
-         <lastmod>2023-10-11</lastmod>
+         <lastmod>2023-10-17</lastmod>
          <changefreq>daily</changefreq>
     </url>
     <url>
          <loc>https://ResidenciaTICBrisa.github.io/07_ProcessamentoLinguagemNatural/management/comunicacao/</loc>
-         <lastmod>2023-10-11</lastmod>
+         <lastmod>2023-10-17</lastmod>
          <changefreq>daily</changefreq>
     </url>
     <url>
          <loc>https://ResidenciaTICBrisa.github.io/07_ProcessamentoLinguagemNatural/management/metodologia/</loc>
-         <lastmod>2023-10-11</lastmod>
+         <lastmod>2023-10-17</lastmod>
          <changefreq>daily</changefreq>
     </url>
     <url>
          <loc>https://ResidenciaTICBrisa.github.io/07_ProcessamentoLinguagemNatural/management/papeis/</loc>
-         <lastmod>2023-10-11</lastmod>
+         <lastmod>2023-10-17</lastmod>
          <changefreq>daily</changefreq>
     </url>
     <url>
          <loc>https://ResidenciaTICBrisa.github.io/07_ProcessamentoLinguagemNatural/project/CODE_OF_CONDUCT/</loc>
-         <lastmod>2023-10-11</lastmod>
+         <lastmod>2023-10-17</lastmod>
          <changefreq>daily</changefreq>
     </url>
 </urlset>
diff --git a/sitemap.xml.gz b/sitemap.xml.gz