Multi-Engine documentverwerking
De juiste engine voor elk document
Vision AI voor visuele lay-outs, Text AI voor platte tekst, sjablonen voor vaste formulieren. Alle drie binnen één mailbox.
Wat je krijgt
Vision AI-extractie
Vision-modellen lezen pagina's als afbeeldingen, niet als tekst. De AI bekijkt het document zoals een mens dat doet, met volledige lay-out en visuele context.
- Ideaal voor rijke PDF's, scans en complexe formulieren
- Pakt handschrift, vinkjes, stempels en lay-outsignalen op
- Instellen in gewoon Nederlands, geen sjabloon nodig
Text AI-extractie
Documenten worden eerst omgezet naar platte tekst, met OCR als er geen tekstlaag is. De AI werkt daarna alleen op die tekst, zonder lay-out of afbeeldingen mee te nemen.
- Perfect voor e-mails, platte PDF's en tekstgerichte documenten
- Handig als de lay-out geen extra info bevat
- Instellen in gewoon Nederlands, geen sjabloon nodig
Extractie op basis van sjablonen
Voeg zoveel sjablonen per mailbox toe als je wilt. Parseur kiest automatisch het beste sjabloon per document en levert elke keer dezelfde output, zonder AI.
- Top voor vaste formulieren en automatisch gegenereerde e-mails
- De meest betrouwbare methode als de lay-out nooit verandert
- Bouw sjablonen visueel, één per documentindeling
Extractie van tabellen en regels
Elke rij in een tabel wordt een apart datarecord, geen samengeplakt veld. Dit werkt met alle drie de engines. Bij spreadsheets gebeurt het tabelparsen automatisch.
- Verwerkt een wisselend aantal rijen per document
- Pakt tabellen die meerdere pagina's beslaan
- AI-engines splitsen complexe, meerregelige rijen in losse velden
OCR voor scans en afbeeldingen
Optische tekenherkenning (OCR) leest tekst van scans, telefoonfoto's en PDF's zonder tekstlaag. Dit levert de tekst voor de Text AI- en sjabloonengines.
- Werkt op scans, telefoonfoto's en PDF's zonder tekstlaag
- Meertalige OCR in 200+ talen, inclusief handschrift
- Sjabloonengine met zonale en dynamische OCR voor elke lay-out
Documentvoorverwerking
Nauwkeurige extractie begint met schone, herstelde input. De voorverwerking van Parseur is uitgehard door meer dan 100 miljoen documenten en tien jaar aan vreemde randgevallen.
- Zet scheve scans recht en herhaalt OCR op onleesbare tekst
- Herstelt corrupte PDF's, kapotte e-mailcodering en rare HTML
- Herkent landspecifieke datum- en nummerformaten automatisch
Zo werkt documentverwerking
Wat er net gebeurde
Documentintake
Documenten zijn geüpload of automatisch binnengekomen via e-mail, API of gekoppelde opslag.
Voorverwerken
Elk document krijgt eerst een opschoningsronde. Parseur checkt de pagina-oriëntatie, zet scheve scans recht en herstelt onleesbare of verkeerd geordende inhoud waar nodig.
OCR
Voor scans, telefoonfoto's en PDF's zonder tekstlaag haalt Parseur de tekst eruit met OCR. Bestanden met een eigen tekstlaag slaan deze stap over.
Engine kiezen
Parseur kiest automatisch de meest geschikte engine per document. Is er een passend sjabloon, dan wint die. Anders pakt Vision AI beeldrijke documenten en Text AI de platte tekst.
Extractie
De gekozen engine haalt gestructureerde velden uit het document, gemapt op het schema dat je in je mailbox hebt ingericht. Daarna gaan de velden door normalisatie en validatie.
Wat er daarna gebeurt
Gegevensnormalisatie en validatie
Geëxtraheerde velden worden gecontroleerd, opgemaakt en klaargezet voor vervolgworkflows.