Sprint 7 - Absinto

Na Sprint 7, a equipe de Business Intelligence teve como missões: Implementar a classificação multirrótulo no pipeline de subsets e continuar com implementação do projeto Nísia Chatbot.  

  Dentro da missão do classificador multirrótulo foi estudado mais a fundo o cleanlab, ferramenta que tem como função detectar possíveis erros de rotulagem que podem estar impactando negativamente nos dados, remover os rótulos “Clínico Geral” e “Médico do Trabalho” dos dados, montar um container com proposta de treinamento, facilitando assim os treinamentos posteriores dos modelos independente de qual ambiente estiverem e não precisando fazer mudanças internas no código para realizar testes específicos. Foi realizado a documentação do classificador multirrótulo especificando o modelo utilizado e os dados para treinamento e por último a verificação de segurança dos dados ao se utilizar o NPAD/UFRN(Núcleo de Processamento de Alto Desempenho) devido estar lidando com informações sensíveis. 

  Em relação a missão do chatbot foram adicionadas mais algumas intenções baseadas na carta de serviço da JFRN; realizou-se mudanças na política de processamento, devido o chat estar com alguns problemas para identificar nomes compostos; criou-se uma conexão com um banco para que as conversas realizadas pelo chat sejam salvas para posterior análise; dockerização do projeto; e foi colocado uma versão de homologação em uma máquina da justiça.  

Datas

Início: 14/10/2022
Entrega: 09/11/2022

Missões

  • Implementar classificação multirrótulo no pipeline de subsets  
  • Continuar implementação do projeto chatbot Nísia 
  • Relações públicas da sprint 

Tarefas

  • Estudar documentação do cleanlab  
  • Remover os rótulos “Clínico Geral” e “Médico do Trabalho” dos dados 
  •  Enviar para Elias um arquivo contendo apenas uma coluna com os textos integrais das petições iniciais dos juizados especiais  
  • Montar container com proposta de treinamento (lambda-labs)  
  • Exportar pipeline completa para treinamento com Elias 
  • Retreino dos modelos usando subsets de acordo com o tempo  
  • Avaliar os modelos na abordagem de subsets de tempo  
  • Documentar modelo multirrótulo  
  •  Verificar segurança de dados no NPAD 
  • Continuar adicionando intenções ao chatbot(carta de servico) 
  • Verificar validação de nomes  
  •  Buscar forma de guardar as conversas em um banco 
  • Colocar versão de homologação em maquina da justiça  
  •  Dockerizar o Nísia  
  • Cadastro das atividades no Jira/Gitlab  
  • Escrever resumo da sprint  
  • Criação do slide para apresentação da sprint 
  • Divulgar mídias da sprint no portal da residência e nuvem  

Entregas

  • Estudar documentação do cleanlab  
  • Remover os rótulos “Clínico Geral” e “Médico do Trabalho” dos dados 
  • Montar container com proposta de treinamento (lambda-labs)  
  • Documentar modelo multirrótulo  
  •  Verificar segurança de dados no NPAD 
  • Continuar adicionando intenções ao chatbot(carta de servico) 
  • Verificar validação de nomes  
  •  Buscar forma de guardar as conversas em um banco 
  • Colocar versão de homologação em maquina da justiça  
  • Dockerizar o Nísia  
  • Cadastro das atividades no Jira/Gitlab  
  • Escrever resumo da sprint  
  • Criação do slide para apresentação da sprint 
  • Divulgar mídias da sprint no portal da residência e nuvem