Looplex Knowledge Base

Extração de Dados Inteligente (EDI)

O conjunto de recursos de Extração de Dados Inteligente (EDI) da Looplex oferece uma gama de serviços e funções inteligentes e de baixo código (low code) para você criar facilmente seu próprio processo de extração de dados originários de documentos estruturados, como planilhas, formulários, “capa” de processo, respostas de API, semiestruturados, como certidões de distribuidores judiciais, notas fiscais, matrículas de imóveis e não estruturados, como a petição da parte contrária, sentenças judiciais, contratos gerados no Word etc.

Como funciona?

Os recursos de EDI identificam relacionamentos de dados de um documento como pares de variável-resposta (key-value). Por exemplo, uma petição contém vários campos de dados variáveis, como o endereçamento, nomes das partes, data, número do processo etc.

Imagem de explicação EDI

Usando as funcionalidades EDI da Looplex, cada chave será mapeada para um campo de tipo (variável) no Template e o valor será atribuído como o dado dessa variável.

O dado dessa variável pode ser atribuído para uma resposta, que é utilizada diretamente na construção do Documento, ou pode ser atribuído para uma variável oculta, que então é operada para mudar a lógica do documento ou calculada para gerar outras respostas.

Quais são os recursos de EDI disponíveis

As opções de Extração de Dados Inteligente na plataforma Looplex são:

  • Importação manual de arquivo: upload de dados pela interface a partir de Excel, CSV, XML, JSON de outro documento gerado anteriormente (arquivo de respostas).
  • Interação Máquina-Máquina de Documentos Looplex: chamada de outro documento, que é instanciado (template é iniciado e executado), permitindo ao template que o chamou operar toda a sua lógica, extrair respostas e pedir cálculo de respostas baseado em parâmetros informados.
  • RPA (Automação de Processo Robótico): Serviço que permite a você configurar um software de computador, ou um “robô”, para emular as ações de um ser humano interagindo com sites, aplicativos ou outros sistemas digitais para executar tarefas pelo computador. Os robôs RPA utilizam a interface do usuário para capturar dados e manipular aplicativos exatamente como os humanos fazem. Eles interpretam, disparam respostas e se comunicam com outros sistemas para realizar uma grande variedade de trabalhos repetitivos.

O robô da Looplex já tem Habilidades pré-treinadas de extração de dados e execução de tarefas. Assim, você pode diretamente dar as instruções relevantes do que quer que ele faça no contexto de um determinado Template, ou você pode treinar uma nova Habilidade.

Você também pode acessar via API outras soluções de RPA de dentro da Looplex, como o Microsoft Power Automate. Veja na documentação da API para mais detalhes.

  • Tube de API: A API é uma interface de computação que define as interações entre diferentes softwares. Ele define os tipos de chamadas ou solicitações que podem ser feitas, como fazê-las, os formatos de dados que devem ser usados e as convenções a seguir. Diferentemente do RPA, que emula humanos interagindo com uma máquina, uma API é o protocolo de comunicação nativo máquina-máquina.
  • Análise assistida de documento: Interface separada no processo de construção de um Documento na Looplex, na qual o usuário é exposto a um arquivo PDF com uma entrevista sequencial semelhante à estrutura de entrevista guiada do próprio Documento Looplex. O usuário marcará no PDF o valor para cada chave solicitada na entrevista de análise assistida, ou validará as marcações de valores encontrados pelo algoritmo de inteligência artificial ou parser de texto da Looplex (técnica humano-no-loop).

Os resultados validados serão então atribuídos na corda do Documento, com o usuário retornando para a entrevista principal do processo de construção.

  • Doc Parser: serviço de análise e decomposição de frases e sequências de palavras em seus constituintes, resultando em uma árvore de análise que mostra sua relação sintática entre eles, que também pode conter semântica e outras informações. Você pode usar expressões regulares (RegEX), scripts e outros métodos para obter da árvore de análise a extração de valores das chaves desejadas.
  • Extração automatizada com IA: serviços de reconhecimento ótico de caracteres (OCR) aprendizado máquina, processamento de linguagem natural (NLP) e deep learning para classificar, categorizar e extrair informações relevantes de documentos não estruturados.

Os resultados da extração automatizada podem ser reconciliados e corrigidos por seres humanos usando o serviço de Análise Assistida de Documento, o que aliás é sempre recomendável se acurácia obtida não estiver melhor que a média humana de erros para trabalhos equivalentes. O mapeamento e qualidade dos resultados fica mais inteligente com o tempo, na medida em que o serviço vai aprendendo com o feedback humano.

Por onde começar?

A Extração de Dados Inteligente oferece um jogo poderoso de ferramentas para usar em seus Templates. Mas antes de começar a usar qualquer uma delas, isoladamente ou em conjunto com outras, pense no que deseja fazer. Por exemplo:

  • Que tipo de input ou documentos externos você quer processar?
  • Quem é responsável por reconciliar e corrigir os resultados?
  • Onde você deseja exibir os dados depois
  • Como você quer que eles sejam usados na construção do documento?
Edit this page on GitHub