Análisis de Documentos con Múltiples Motores
El motor de análisis adecuado para cada documento
IA de Visión para diseños visuales, IA de Texto para texto plano, plantillas para formularios fijos. Los tres motores funcionan en el mismo buzón.
Qué incluye
Extracción con IA de Visión
Los modelos de visión leen las páginas como imágenes, no como texto. La IA ve el documento como lo haría una persona, con todo el contexto visual y de diseño.
- Ideal para PDFs complejos, escaneos y formularios con diseño rico
- Captura escritura a mano, casillas, sellos y otros elementos visuales
- Se configura con instrucciones en lenguaje natural, sin plantillas
Extracción con IA de Texto
Los documentos se convierten primero a texto plano, aplicando OCR si no hay capa de texto nativa. La IA analiza solo el texto, ignorando diseño e imágenes.
- Ideal para correos, PDFs simples y otros documentos basados en texto
- Útil cuando el diseño visual no aporta información
- Se configura con instrucciones en lenguaje natural, sin plantillas
Extracción basada en plantillas
Crea tantas plantillas por buzón como necesites. Parseur elige la mejor para cada documento y produce siempre el mismo resultado, sin intervención de IA.
- Ideal para formularios estandarizados y correos generados por máquina
- El método más fiable cuando el diseño nunca cambia
- Se configura con el editor visual, una plantilla por cada diseño
Extracción de tablas y líneas de detalle
Cada fila de una tabla se convierte en un registro propio, no en un único campo combinado. Funciona en los tres motores. Las hojas de cálculo nativas se procesan solas.
- Soporta un número variable de filas en cada documento
- Maneja tablas que se extienden a lo largo de varias páginas
- Los motores de IA extraen filas complejas y multilínea como campos
OCR para escaneos e imágenes
El Reconocimiento Óptico de Caracteres lee texto en escaneos, fotos de móvil y PDFs solo con imágenes. Alimenta a los motores de IA y plantillas cuando no hay capa de texto.
- Funciona con escaneos, fotos de móvil y PDFs solo con imágenes
- OCR multilingüe en más de 200 idiomas, incluida la escritura a mano
- El motor de plantillas usa OCR Zonal y OCR Dinámico para cada diseño
Preprocesamiento de documentos
Una extracción precisa empieza por limpiar y reparar los documentos. El preprocesamiento de Parseur se ha afinado con 100M+ documentos y una década de casos extremos.
- Endereza escaneos inclinados y vuelve a aplicar OCR a texto ilegible
- Repara PDFs corruptos, correos con codificación rota y HTML mal formado
- Detecta automáticamente formatos locales de fecha y número
¿Cómo funciona el análisis de documentos?
Lo que acaba de ocurrir
Recepción de documentos
Los documentos se subieron o llegaron automáticamente por correo, API o almacenamiento conectado.
Preprocesar
Cada documento pasa primero por una fase de limpieza. Parseur corrige la orientación de las páginas, endereza los escaneos torcidos y repara contenido distorsionado o desordenado cuando hace falta.
OCR
Para escaneos, fotos de móvil y PDFs solo con imágenes, Parseur ejecuta OCR para extraer el texto. Los documentos con capa de texto nativa se saltan este paso.
Elige el motor
Parseur elige automáticamente el motor adecuado para cada documento. Si hay una plantilla que coincide, esa tiene prioridad. Si no, la IA de Visión se ocupa de las páginas con contenido visual rico y la IA de Texto, de los documentos de texto plano.
Extraer
El motor seleccionado extrae los campos estructurados según el esquema de tu buzón. Desde aquí, cada campo continúa hacia la normalización para darle formato y validarlo.
Lo que ocurre después
Normalización y validación de datos
Los campos extraídos se validan, formatean y estructuran para los siguientes pasos del flujo de trabajo.