Sprint 2 - Tea Party

Para a Sprint 2, a equipe de Business Intelligence (BI), teve como missão preparar o CEOS, API do classificador de petições iniciais, para interação com os servidores da Justiça, com o objetivo de coletar o feedback acerca de seu funcionamento. Ademais, a outra missão primordial a esse período de trabalho era documentar o pipeline do versionamento e controle dos modelos do Classificador, dando continuidade à iniciativa da sprint anterior de adequar os projetos ao pipeline de MLOps.

Quanto à primeira missão, dentre as tarefas atribuídas à sprint e efetivamente entregues, pode-se citar: a identificação das requisições feitas pelo frontend do CEOS e configuração de novas requisições a serem implementadas; treinamento do uso do CEOS e classificador para usuários; fazer análise de uso da ferramenta pelos usuários; revisar código de pré-processamento dos dados do classificador; e adaptar a pipeline de pré-processamento dos dados para criação de multirrótulos.

Para a avaliação do uso do sistema do classificador de petições iniciais, foram escolhidos os servidores Ivanaldo Rodrigues, da 7ª vara da JFRN, e Hudson Paulinelli, da 3ª vara da JFRN. Durante uma série de encontros, tanto presencial quanto de forma remota, os servidores receberam um treinamento de uso do CEOS; passaram por um período de interação com o sistema; e, ao final, seus feedbacks foram coletados por meio de entrevista e formulário online. Além disso, também foi preparado um manual, para os usuários, contendo o passo-a-passo de utilização do sistema.

Com o objetivo de identificar e compreender as regras de negócio tomadas durante a importação e limpeza dos textos das petições iniciais, foi elaborada uma documentação a respeito do pré-processamento dos dados para o classificador. Essa imersão contribuiu para a tarefa seguinte de adaptar o pipeline de pré-processamento para criação de multirrótulos, os quais serão adotados no posterior retreinamento do segundo modelo responsável por classificar as especialidades das perícias. 

Passando para as tarefas da segunda missão, o foco foi direcionado para a continuidade da aplicação de ferramentas de versionamento no projeto do classificador. Uma documentação, para utilização do DVC e TensorBoard, foi produzida e deu-se início à refatoração do código dos modelos para inserir no pipeline do DVC. Por fim, a equipe fez estudos sobre a melhor forma de executar a conexão do DVC com a infraestrutura da Justiça. 

 
 

Datas

Início: 16/06/2022
Entrega: 13/07/2022

Missões

  • Disponibilizar o CEOS para os stakeholders;
  • Documentar o pipeline do versionamento e controle dos modelos.

Tarefas

  • Identificar todas as requisições feitas pelo frontend;
  • Configuração de novas requisições;
  • Treinamento de uso do CEOS e classificador para usuários;
  • Fazer análise de uso da ferramenta pelos usuários (in loco);
  • Revisar código de importação de dados e limpeza dos textos (para documentar as regras de pré-processamento);
  • Adaptar pipeline de limpeza dos dados para criação de multi rótulos;
  • Estudar melhor conexão do DVC com a infra da Justiça;
  • Criar projeto base totalmente configurado para utilizar DVC e TensorBoard;
  • Documentação para utilização do DVC e TensorBoard.

Entregas

  • Novas requisições integradas ao CEOS;
  • Material de treinamento e avaliação de feedback do Classificador;
  • Documentação do pipeline de pré-processamento dos dados para o Classificador;
  • Novo pipeline de pré-processamento dos dados com implementação de multirrótulos;
  • Documentação para utilização do DVC e TensorBoard;
  • Código refatorado do Classificador para inserir no pipeline do DVC.