De meest nauwkeurige OCR-software
Parseur maakt gebruik van de nieuwste AI- en machine learning-technologieën om tekst uit documenten te herkennen met de hoogste nauwkeurigheid. Onze engine heeft al miljoenen pagina's verwerkt in allerlei sectoren, waaronder financiën, verzekeringen, vastgoed, logistiek en e-commerce.
OCR is de basis van gegevens-extractie
Optical Character Recognition is de technologie die computers in staat stelt tekst uit documenten te herkennen en te extraheren. Een nauwkeurige OCR-engine vormt de basis van ieder betrouwbaar gegevensextractieproces. De OCR-engine van Parseur gebruikt Computer Vision en Natural Language Processing (NLP), met modellen die getraind zijn op de grootste datasets op de markt.
OCR voor iedereen
Onze engine maakt het mogelijk om tekst uit alle soorten documenten te herkennen.
-
Tekstgebaseerde PDF's
- Herken tekst uit de tekstlaag van PDF's (wanneer aanwezig). Deze PDF's met tekst worden ook wel doorzoekbare PDF's of PDF/A genoemd en zijn gangbaar in gebruik.
-
Gescande PDF's
- Voor gescande PDF-bestanden die geen tekstlaag bevatten maar enkel afbeeldingen, voert Parseur Computer Vision uit om tekst zeer nauwkeurig te herkennen en te extraheren.
-
E-mails en tekstbestanden
- Herken tekst in e-mails (inclusief opgemaakte e-mails met afbeeldingen en links) en andere tekstbestanden met 100% nauwkeurigheid.
-
Spreadsheets en meer
- Parseur kan ook tekst herkennen in spreadsheets (Excel, CSV's), Word-documenten, webpagina's en meer. Bekijk de volledige lijst van ondersteunde bestandsformaten.
Ondersteunt de meeste talen
Grote trainingsdatasets zijn de pijlers van een zeer nauwkeurige OCR-engine. Onze OCR-engine wordt continu getraind met grote, taalspecifieke datasets van over de hele wereld.-
Meer dan 60 talen ondersteund
- Onze OCR-engine is uitgebreid getraind om tekst te herkennen in meer dan 60 talen, waaronder Engels, Spaans, Frans, Duits, Nederlands, Russisch, Japans, Koreaans, Chinees, Hebreeuws, Arabisch, Hindi en meer. Daarnaast is er experimentele ondersteuning voor nog eens ruim 160 talen.
-
Herken handschrift
- Parseur kan handgeschreven tekst herkennen in het Latijnse, Japanse en Koreaanse schrift. Ook is er experimentele ondersteuning voor andere handgeschreven alfabetten, waaronder Chinees, Grieks, Cyrillisch en Vietnamees.
Ga verder dan alleen OCR
OCR extraheert de ruwe tekst uit jouw documenten, als ongestructureerde data. Deze basisdata kan vervolgens in onze visuele Point & Click-template editor en via onze Zonale OCR- en Dynamische OCR-pijplijnen worden verwerkt tot zeer betrouwbare gestructureerde gegevens.
Krachtige template-engine
Extraheer data uit verschillende layouts door meerdere templates aan te maken en automatische layoutdetectie te gebruiken.
Zonale OCR
Met Zonale OCR haal je tekst uit velden die altijd op dezelfde positie staan in soortgelijke documenten.
Dynamische OCR
Met Dynamische OCR kun je eenvoudig tekst extraheren uit velden die horizontaal, verticaal bewegen of van grootte veranderen tussen documenten.



