Sprint 7 - Absinto
Na Sprint 7, a equipe de Business Intelligence teve como missões: Implementar a classificação multirrótulo no pipeline de subsets e continuar com implementação do projeto Nísia Chatbot.
Dentro da missão do classificador multirrótulo foi estudado mais a fundo o cleanlab, ferramenta que tem como função detectar possíveis erros de rotulagem que podem estar impactando negativamente nos dados, remover os rótulos “Clínico Geral” e “Médico do Trabalho” dos dados, montar um container com proposta de treinamento, facilitando assim os treinamentos posteriores dos modelos independente de qual ambiente estiverem e não precisando fazer mudanças internas no código para realizar testes específicos. Foi realizado a documentação do classificador multirrótulo especificando o modelo utilizado e os dados para treinamento e por último a verificação de segurança dos dados ao se utilizar o NPAD/UFRN(Núcleo de Processamento de Alto Desempenho) devido estar lidando com informações sensíveis.
Em relação a missão do chatbot foram adicionadas mais algumas intenções baseadas na carta de serviço da JFRN; realizou-se mudanças na política de processamento, devido o chat estar com alguns problemas para identificar nomes compostos; criou-se uma conexão com um banco para que as conversas realizadas pelo chat sejam salvas para posterior análise; dockerização do projeto; e foi colocado uma versão de homologação em uma máquina da justiça.
Datas
Início: 14/10/2022
Entrega: 09/11/2022
Missões
- Implementar classificação multirrótulo no pipeline de subsets
- Continuar implementação do projeto chatbot Nísia
- Relações públicas da sprint
Tarefas
- Estudar documentação do cleanlab
- Remover os rótulos “Clínico Geral” e “Médico do Trabalho” dos dados
- Enviar para Elias um arquivo contendo apenas uma coluna com os textos integrais das petições iniciais dos juizados especiais
- Montar container com proposta de treinamento (lambda-labs)
- Exportar pipeline completa para treinamento com Elias
- Retreino dos modelos usando subsets de acordo com o tempo
- Avaliar os modelos na abordagem de subsets de tempo
- Documentar modelo multirrótulo
- Verificar segurança de dados no NPAD
- Continuar adicionando intenções ao chatbot(carta de servico)
- Verificar validação de nomes
- Buscar forma de guardar as conversas em um banco
- Colocar versão de homologação em maquina da justiça
- Dockerizar o Nísia
- Cadastro das atividades no Jira/Gitlab
- Escrever resumo da sprint
- Criação do slide para apresentação da sprint
- Divulgar mídias da sprint no portal da residência e nuvem
Entregas
- Estudar documentação do cleanlab
- Remover os rótulos “Clínico Geral” e “Médico do Trabalho” dos dados
- Montar container com proposta de treinamento (lambda-labs)
- Documentar modelo multirrótulo
- Verificar segurança de dados no NPAD
- Continuar adicionando intenções ao chatbot(carta de servico)
- Verificar validação de nomes
- Buscar forma de guardar as conversas em um banco
- Colocar versão de homologação em maquina da justiça
- Dockerizar o Nísia
- Cadastro das atividades no Jira/Gitlab
- Escrever resumo da sprint
- Criação do slide para apresentação da sprint
- Divulgar mídias da sprint no portal da residência e nuvem