Normalização e Validação de Dados
Mesmo formato, dados limpos para cada documento
De esquemas de caixa de entrada ao pós-processamento, cada valor extraído chega limpo, validado e pronto para os sistemas posteriores.
O que está incluído
Esquemas por caixa de entrada
Defina seus campos uma vez e todo documento processado pela caixa de entrada segue o mesmo formato. É o que torna integrações e automações confiáveis.
- Campos padrão para valores únicos e campos de tabela para listas
- Instruções em linguagem simples orientam a IA em cada campo
- Ajuste os campos pela interface ou via API a qualquer momento
Formatação por campo
Formatos prontos normalizam datas, números, nomes e endereços. O formato adequado é inferido pelo contexto do documento, com o padrão da caixa como alternativa.
- Datas em qualquer ordem, separador ou nome de mês, em vários idiomas
- Números com qualquer separador decimal ou de milhares por região
- Endereços geolocalizados e divididos em partes estruturadas
Validação de dados
Cada valor extraído passa pelo esquema da caixa de entrada. Em caso de falha, o documento é sinalizado na interface, por e-mail e por webhook, sem passar despercebido.
- Validação de esquema confere a saída da IA contra o tipo do campo
- Campos obrigatórios sinalizam valores ausentes na origem
- Campos de escolha barram valores fora da lista permitida
Regras de pós-processamento
Quando as regras padrão não bastam, adicione scripts Python personalizados. As regras são executadas após a extração para reformatar ou validar valores de acordo com a lógica do seu negócio.
- Combine, divida ou calcule novos campos a partir dos valores extraídos
- Aplique lógica de negócios, buscas e transformações condicionais
- Disponível no plano Pro e superiores
Como funciona a Normalização de Dados
O que acabou de acontecer
Leitura de Documentos Multi-Engine
Vision IA, Texto IA, templates ou OCR extraíram campos estruturados de cada documento.
Mapear para o esquema
Valores extraídos são conectados ao conjunto fixo de campos definidos para cada caixa de entrada. Independente do layout do documento de origem, a saída mantém sempre a mesma estrutura.
Formatar
Cada campo passa pela formatação selecionada. Datas e números são padronizados entre variações regionais com base no contexto, nomes são divididos em nome e sobrenome, e endereços em partes estruturadas.
Validar
Cada resultado passa por validação antes de seguir para a próxima etapa. Documentos aprovados continuam para o pós-processamento; os demais são sinalizados para garantir que nada fuja ao controle do Parseur.
Pós-processar
Regras opcionais em Python são executadas por último, permitindo adaptar a saída conforme regras específicas do seu negócio. Combine campos, conecte dados de referência ou modele as informações exportadas conforme contratos do seu sistema.
O que acontece depois
Exportações e Integrações em Tempo Real
Dados normalizados são entregues em seu CRM, sistema contábil ou banco de dados em tempo real.