Dynamisk OCR: avancerad datainhämtning från dokument
Dynamisk OCR är vår mest avancerade teknik för att extrahera datapunkter från dokument. Den kan dynamiskt hitta fält som flyttar sig eller ändrar storlek från ett dokument till ett annat.
När behöver du Dynamisk OCR?
Använd Dynamisk OCR när du arbetar med dokument som har liknande layout, men där fält kan flytta sig eller ändra storlek mellan varje dokument.
Fältpositionen varierar
Tabeller eller valfria fält är de främsta orsakerna till förändringar i layouten, vilket gör att olika fält flyttas på dokumentet.
-
Efter tabellfält
- Tabeller med ett varierande antal rader leder ofta till att layouten under dem förskjuts.
-
Efter valfria fält
- Valfria informationsfält, som en andra adressrad eller tillval som storlek eller färg på en produkt, kan också orsaka att alla efterföljande fält förskjuts.
Fältstorleken varierar
I de flesta fall är dina fält begränsade till ett bestämt område på dokumentet. Men ibland, som vid flerradiga kommentarer eller tabeller med flera rader, kan fältens storlek variera.
-
Varierande antal tabellrader
- Eftersom antalet rader i en tabell kan skilja sig från dokument till dokument, förändras även storleken på tabellfältet. Därför måste du kunna ange för verktyget var tabellen slutar.
-
Varierande antal rader
- Fält som textrutor med kommentarer eller anteckningar kan innehålla olika antal rader. Ditt dataextraktionsverktyg behöver förstå var fältet börjar och slutar.
Hur fungerar Dynamisk OCR?
Med Dynamisk OCR introduceras konceptet etiketter. En etikett är en textrad på dokumentet som fungerar som en referenspunkt för att placera ditt fält. Istället för att sätta fältet på en fast plats, så som i Zonal OCR, identifierar Parseur först etiketten och använder dess position för att dynamiskt lokalisera tillhörande fält.
-
1
Skapa en etikett
- Rita en ruta över den text du vill använda som ankare och klicka på "Skapa etikett".
-
2
Skapa ett fält och knyt till etiketten
- Markera de data du vill extrahera, ge fältet ett namn och välj den etikett du nyligen skapade. Detta instruerar Parseur att fältets position är relativ till etiketten och inte fast.
-
3
Skapa avslutande etikett (valfritt)
- Om fältets storlek kan variera kan du lägga till en andra etikett under fältet som avslutande punkt. Parseur använder då den första etiketten för att hitta fältets början och den andra för att definiera slutet.
-
Upprepa processen
- Gör detta för varje fält – klart! Flera fält kan använda samma etikett(er). Etiketter, precis som fält, kan anges som valfria eller obligatoriska.
Den mest intelligenta dokumentbehandlingsmjukvaran
Dynamisk OCR, tillsammans med våra övriga dataextraktionsfunktioner, gör Parseur till den mest flexibla plattformen för datautvinning från dokument.
Bäst i klassen OCR-mjukvara
Parseurs OCR-noggrannhet är ledande på marknaden. Den stödjer de flesta språk, även handskriven text, och ger snabba resultat.
Kraftfull mallmotor
Extrahera data från olika layouter genom att skapa flera mallar och använda automatisk layoutdetektering.
Zonal OCR
Med Zonal OCR kan du extrahera text från fält som finns på en fast plats i varje liknande dokument.