Sprint 4 – Champagne – Residencia TI

25 agosto 2022

Sprint 4 - Champagne

Para a Sprint 4, a equipe de Business Intelligence (BI) teve como missões: estudar o método de integração do modelo com o PDPJ; implementar o classificador multirrótulo ao modelo; ajustes para extração dos dados do CRETA; implantação do pipeline de versionamento; testar o classificador com os dados mais recentes da base de dados; e testagem do CEOS com novos servidores.

Dando continuidade à sprint anterior, a pesquisa acerca do PDPJ foi aprofundada por meio da incorporação de outras fontes de informações técnicas da plataforma e uma reunião com Willen Leiros, supervisor da Seção de Sistemas da JFRN. Observou-se que a missão de integração com o PDPJ precisa inicialmente de uma solicitação ao CNJ e posterior homologação e acordo de cooperação técnica. Sendo assim, um pedido já foi encaminhado e está sendo aguardado resposta para iniciar todos os tramites.

Outra missão que iniciou na sprint anterior e perdurou até a atual é a implementação do classificador multirrótulo com a finalidade de substituir o segundo modelo da versão atual do Classificador de Petições Iniciais, o qual é multiclasse. Foi realizado um estudo dedicado a Aprendizado Profundo, Processamento de Linguagem Natural e fast.ai, biblioteca voltada para construção de redes neurais, com o intuito de guiar o desenvolvimento do modelo multirrótulo. Após finalizada essa etapa de imersão, produziu-se o código e o modelo foi treinado.

Para a criação dessa nova versão do modelo, estabeleceu-se que seria necessário atualizar o conjunto de dados de processos do CRETA usados até então. Contudo, foi identificado que as querys de extração dos dados precisavam ser revisadas e refatoradas para posteriormente realizar a extração de dados de julho de 2019 à fevereiro de 2022. Durante essa extração, tomou-se como premissa o hábito observado de que, durante a tramitação de uma ação judicial, o primeiro documento inserido corresponde à petição inicial. Com o intuito de validar essa ideia, foram elaborados testes em uma amostra de dados selecionados aleatoriamente. Diante da proporção insatisfatória de processos que apresentaram o primeiro documento como petição inicial, decidiu-se que a premissa deve ser alterada.

Foi iniciada, também, a testagem do classificador com esses novos dados, por meio de avaliação de desempenho com base nas métricas aplicadas durante o treinamento dos modelos. Atualmente tem-se como finalizada a avaliação do modelo binário e está em desenvolvimento a análise do modelo multiclasse e a distribuição mensal para ambos.

Quanto ao processo de versionamento do Classificador de Petições Iniciais, o processo de adequação do projeto às diretrizes do DVC foi finalizado através da unificação da coleta e tratamento dos dados em arquivo único garantindo auditabilidade dos modelos. Além disso, também foi adicionado o código de treinamento dos modelos à pipeline.

Com relação ao CEOS, foi efetuado o treinamento de novos servidores que trabalham com triagem de pericias. Para essa nova etapa de testes com a ferramenta de classificação de perícias, um prazo foi definido para verificação da assertividade e algum possível erro relacionado. Terminado esse período, é feito um novo encontro com os mesmos para coletar os feedbacks, tendo como objetivo investigar a percepção deles sobre o funcionamento do sistema como um instrumento na sua jornada de trabalho, além de conseguir identificar novos recursos e posterior melhorias.

Datas

Início: 04/08/2022
Entrega: 24/08/2022

Missões

Estudo da PDPJ ;
Implementar o classificador multirrótulo no modelo;
Ajustes necessários na extração de dados do CRETA;
Implantação do pipeline de versionamento;
Testagem do Classificador com a versão atualizada da base de dados;
Testes de uso do CEOS com os servidores.

Tarefas

Estudar como integrar a API do modelo de classificação com o PJe;
Montar apresentação acerca do PDPJ para toda a equipe;
Propor mudanças no código para classificação multirrótulo;
Treinamento do modelo multirrótulo;
Revisar e refatorar as querys de extração dos dados;
Fazer testes de validação da petição inicial;
Fazer uma verificação manual dos processos que não tem a petição inicial como o primeiro documento;
Unificar a coleta e tratamento dos dados em um único arquivo;
Configurar DVC para armazenar dados no servidor;
Adicionar código de treinamento dos modelos à pipeline;
Extrair e tratar os dados da versão atualizada do banco;
Realizar análise do desempenho dos modelos com os novos dados;
Realizar análise do desempenho mensal dos modelos com os novos dados;
Fazer uma pesquisa com os servidores acerca do CEOS.

Entregas

Apresentação sobre o PDPJ;
Modelo multirrótulo treinado;
Nova query de extração dos dados;
Testes de validação da petição inicial e verificação do primeiro documento;
Implantação da pipeline de versionamento;
Testagem do modelo binário do Classificador com a versão atualizada da base de dados;
Treinamento de novos servidores no uso do CEOS;
Coleta do feedback dos servidores.