Datanormalisering och validering
Samma struktur, ren data från varje dokument
Från brevlådans schema till efterbearbetningen landar varje extraherat värde rent, validerat och redo för dina system.
Det här ingår
Brevlådescheman
Ett konsekvent schema gör efterföljande integrationer och automationer pålitliga. Definiera fälten en gång, så mappas alla dokument som brevlådan tar emot till samma struktur.
- Standardfält för enskilda värden, tabellfält för upprepade rader
- Instruktioner i klartext styr vad AI:n ska fånga i varje fält
- Justera fälten när som helst via gränssnittet eller via API:t
Fältnivåformatering
Inbyggda format normaliserar datum, siffror, adresser och mer. Rätt format avgörs utifrån dokumentets kontext, med brevlådans inställning som reserv.
- Datum tolkas oavsett ordning, avskiljare eller månadsnamn
- Siffror tolkas oavsett decimal- eller tusentalsavgränsare
- Adresser geokodas och delas upp i strukturerade komponenter
Datavalidering
Varje extraherat värde stäms av mot brevlådans schema. Fel visas i gränssnittet, skickar mejlnotis och utlöser en webhook, så driftteam och system får besked direkt.
- Schemakontroll säkerställer att AI-resultatet matchar fältstrukturen
- Kontroll av obligatoriska fält fångar saknade värden vid källan
- Validering mot listor av tillåtna värden upptäcker felaktiga poster
Efterbearbetningsregler
Räcker inte standardformatering och validering till kan du lägga till egna Python-skript. De körs efter extraktion och formar om värden eller validerar enligt din affärslogik.
- Kombinera, dela upp eller beräkna nya fält från extraherade värden
- Tillämpa affärslogik, uppslag eller villkorade transformationer
- Tillgängligt på Pro-planen och uppåt
Så fungerar datanormaliseringen
Vad hände nyss
Dokumentparsning med flera motorer
Vision AI, Text AI, mallar eller OCR hämtade strukturerade fält från varje dokument.
Mappa till schema
Extraherade värden mappas till en fast uppsättning fält som definieras för brevlådan. Oavsett källa får varje dokument samma kolumnstruktur i utdata.
Formatera
Varje fält bearbetas enligt sitt konfigurerade format. Datum och siffror normaliseras oavsett regional variation genom att tolka dokumentets kontext. Namn delas upp i för-, mellan- och efternamn, och adresser bryts ned i strukturerade delar.
Validera
Varje värde stäms av mot valideringsreglerna innan data går vidare. Dokument som klarar kontrollen går till efterbearbetning. Övriga flaggas, så inget lämnar Parseur obemärkt.
Efterbearbeta
Valfria Python-regler körs sist och tillämpar affärslogik som inte kan uttryckas med vanlig fältformatering. Kombinera fält, slå upp referensdata eller forma utdata exakt som dina system kräver.
Vad händer sedan
Export och integration i realtid
Normaliserad data levereras till ditt CRM, bokföringssystem eller databas i realtid.