Gegevensnormalisatie en validatie
Eén format, schone data uit elk document
Vaste velden per mailbox, datums en bedragen in één formaat, en validatie voordat er ook maar iets jouw systemen in gaat.
Wat je krijgt
Schema per mailbox
Definieer je velden één keer per mailbox. Elk document dat binnenkomt wordt naar exact dezelfde structuur gemapt, zodat downstream-integraties gewoon werken.
- Standaardvelden voor losse waarden, tabelvelden voor herhalende data
- Vertel de AI in normaal Nederlands wat per veld nodig is
- Pas velden op elk moment aan via de UI of de API
Formaten per veld
Ingebouwde formaten normaliseren datums, getallen, namen en adressen. Parseur leidt het juiste format af uit de context van het document, met de mailbox-standaard als fallback.
- Leest datums in elke volgorde, scheiding of taal
- Begrijpt elk decimaal- of duizendtalteken in getallen
- Splitst adressen automatisch in gestructureerde onderdelen
Validatie op elke waarde
Elke geëxtraheerde waarde wordt getoetst aan het schema. Fouten verschijnen direct in de UI, sturen een e-mail, en triggeren een webhook richting jouw tooling.
- Schema-check toetst of het AI-resultaat past bij het veldformaat
- Verplichte-veldcheck signaleert missende waarden direct
- Keuzevelden markeren waarden buiten de toegestane lijst
Nabewerkingsregels
Heb je meer nodig dan standaard formats en validatie? Voeg een kort Python-script toe dat na extractie draait om velden te herstructureren of je eigen logica toe te passen.
- Combineer, splits of bereken nieuwe velden uit de extractie
- Pas bedrijfslogica toe, raadpleeg lookups, of voer transformaties uit
- Beschikbaar vanaf het Pro-abonnement
Hoe gegevensnormalisatie werkt
Wat er net gebeurde
Multi-engine Document Parsing
Vision AI, Text AI, templates of OCR hebben gestructureerde velden uit elk document gehaald.
Mappen naar schema
Geëxtraheerde waarden landen in de vaste set velden die je voor de mailbox hebt gedefinieerd. Elk document, ongeacht de lay-out, komt er met dezelfde kolomstructuur uit.
Formatteren
Elk veld loopt door het ingestelde format. Datums en getallen worden genormaliseerd over regionale verschillen heen, op basis van de context van het document. Namen worden gesplitst in voornaam, tussenvoegsel en achternaam. Adressen worden uitgesplitst in gestructureerde onderdelen.
Valideren
Elke waarde gaat door een validatiecheck voordat het document doorstroomt. Alles goed? Door naar nabewerking. Fouten? Die worden gemarkeerd, zodat er nooit iets Parseur verlaat zonder controle.
Nabewerken
Optionele Python-regels draaien als laatste stap, zodat je bedrijfslogica kunt toevoegen die met veldformaten alleen niet lukt. Combineer velden, raadpleeg referentiedata, of pas de output aan op het exacte contract van jouw downstream-systeem.
Wat er daarna gebeurt
Realtime export en integraties
Genormaliseerde data wordt direct geleverd aan je CRM, boekhoudsysteem of database.