Estrazione dati con più motori
Il motore di estrazione giusto per ogni documento
Vision AI per i layout visivi, Text AI per il solo testo, modelli per i formati fissi. Tutti e tre i motori operano in parallelo nella stessa casella.
Cosa è incluso
Estrazione con Vision AI
I modelli Vision analizzano le pagine come immagini, non solo come testo. L'IA legge il documento come farebbe una persona, cogliendo layout e indizi visivi.
- Ideale per PDF complessi, scansioni e moduli articolati
- Riconosce scrittura a mano, caselle spuntate, timbri e segni visivi
- Si configura con istruzioni in inglese, senza definire un modello
Estrazione con Text AI
I documenti vengono prima convertiti in testo semplice, con OCR se manca il testo nativo. L'IA analizza solo il contenuto testuale, ignorando layout e immagini.
- Ottima per email, PDF semplici e altri documenti testuali
- Perfetta quando il layout non incide sui dati estratti
- Si configura con istruzioni in inglese, senza modello dedicato
Estrazione basata su modelli
Aggiungi un numero illimitato di modelli a ogni casella. Parseur sceglie da solo il modello giusto per ogni documento e restituisce sempre lo stesso output, senza ricorrere all'IA.
- Ideale per moduli standardizzati ed email automatiche
- Metodo affidabile per layout che non cambiano mai
- Si crea con un editor visuale, un modello per ogni layout
Estrazione di tabelle e righe
Ogni riga di una tabella viene estratta come record a sé, non come un unico campo concatenato. Funziona con tutti e tre i motori. Per i fogli di calcolo nativi, le tabelle vengono interpretate in automatico.
- Gestisce un numero variabile di righe tra documenti diversi
- Supporta tabelle che si estendono su più pagine
- I motori IA estraggono anche righe complesse su più linee
OCR per scansioni e immagini
L'OCR (Riconoscimento Ottico dei Caratteri) legge il testo da scansioni, foto e PDF di sole immagini, alimentando Text AI e i modelli quando manca uno strato di testo nativo.
- Funziona su scansioni, foto da smartphone e PDF di sole immagini
- OCR in oltre 200 lingue, inclusa la scrittura a mano
- Il motore modelli usa OCR Zonale e OCR Dinamico per ogni layout
Pre-elaborazione dei documenti
Per un'estrazione accurata, ogni documento viene prima ripulito e ricostruito. La pre-elaborazione di Parseur è stata affinata su oltre 100 milioni di documenti in dieci anni di casi reali.
- Corregge scansioni inclinate e rilancia l'OCR sul testo danneggiato
- Ripara PDF corrotti, encoding email errati e HTML malformato
- Rileva in automatico i formati locali di data e numero
Come funziona l'estrazione dati dai documenti
Cosa è appena successo
Acquisizione del documento
I documenti vengono caricati o ricevuti in automatico tramite email, API o storage connesso.
Pre-elaborazione
Ogni documento passa prima da una fase di pulizia. Parseur corregge l'orientamento delle pagine, raddrizza le scansioni storte e, se serve, ripara contenuti danneggiati o alterati.
OCR
Per scansioni, foto e PDF privi di testo nativo, Parseur avvia l'OCR per estrarre il testo. Se il documento ha già uno strato di testo, questo passaggio viene saltato.
Scelta del motore
Parseur sceglie in automatico il motore di estrazione più adatto a ogni documento. Quando esiste un modello che corrisponde viene usato per primo, altrimenti Vision AI gestisce i documenti visivamente complessi e Text AI quelli di solo testo.
Estrazione
Il motore scelto estrae i dati strutturati e li mappa sullo schema che hai definito nella casella. Da qui ogni campo viene normalizzato per formattazione e validazione.
Cosa succede dopo
Normalizzazione e validazione dei dati
I dati estratti vengono validati, formattati e adattati ai tuoi flussi a valle.