De meest nauwkeurige OCR-software

Parseur maakt gebruik van de nieuwste AI- en machine learning-technologieën om tekst uit documenten te herkennen met de hoogste nauwkeurigheid. Onze engine heeft al miljoenen pagina's verwerkt in allerlei sectoren, waaronder financiën, verzekeringen, vastgoed, logistiek en e-commerce.

Upload document

OCR is de basis van gegevens-extractie

Optical Character Recognition is de technologie die computers in staat stelt tekst uit documenten te herkennen en te extraheren. Een nauwkeurige OCR-engine vormt de basis van ieder betrouwbaar gegevensextractieproces. De OCR-engine van Parseur gebruikt Computer Vision en Natural Language Processing (NLP), met modellen die getraind zijn op de grootste datasets op de markt.

OCR voor iedereen

Onze engine maakt het mogelijk om tekst uit alle soorten documenten te herkennen.

Tekstgebaseerde PDF's: Herken tekst uit de tekstlaag van PDF's (wanneer aanwezig). Deze PDF's met tekst worden ook wel doorzoekbare PDF's of PDF/A genoemd en zijn gangbaar in gebruik.
Gescande PDF's: Voor gescande PDF-bestanden die geen tekstlaag bevatten maar enkel afbeeldingen, voert Parseur Computer Vision uit om tekst zeer nauwkeurig te herkennen en te extraheren.
E-mails en tekstbestanden: Herken tekst in e-mails (inclusief opgemaakte e-mails met afbeeldingen en links) en andere tekstbestanden met 100% nauwkeurigheid.
Spreadsheets en meer: Parseur kan ook tekst herkennen in spreadsheets (Excel, CSV's), Word-documenten, webpagina's en meer. Bekijk de volledige lijst van ondersteunde bestandsformaten.

Ondersteunt de meeste talen

Grote trainingsdatasets zijn de pijlers van een zeer nauwkeurige OCR-engine. Onze OCR-engine wordt continu getraind met grote, taalspecifieke datasets van over de hele wereld.

Meer dan 60 talen ondersteund: Onze OCR-engine is uitgebreid getraind om tekst te herkennen in meer dan 60 talen, waaronder Engels, Spaans, Frans, Duits, Nederlands, Russisch, Japans, Koreaans, Chinees, Hebreeuws, Arabisch, Hindi en meer. Daarnaast is er experimentele ondersteuning voor nog eens ruim 160 talen.
Herken handschrift: Parseur kan handgeschreven tekst herkennen in het Latijnse, Japanse en Koreaanse schrift. Ook is er experimentele ondersteuning voor andere handgeschreven alfabetten, waaronder Chinees, Grieks, Cyrillisch en Vietnamees.

Ga verder dan alleen OCR

OCR extraheert de ruwe tekst uit jouw documenten, als ongestructureerde data. Deze basisdata kan vervolgens in onze visuele Point & Click-template editor en via onze Zonale OCR- en Dynamische OCR-pijplijnen worden verwerkt tot zeer betrouwbare gestructureerde gegevens.

Krachtige template-engine

Extraheer data uit verschillende layouts door meerdere templates aan te maken en automatische layoutdetectie te gebruiken.

Meer over onze template-engine

Zonale OCR

Met Zonale OCR haal je tekst uit velden die altijd op dezelfde positie staan in soortgelijke documenten.

Meer over Zonale OCR

Dynamische OCR

Met Dynamische OCR kun je eenvoudig tekst extraheren uit velden die horizontaal, verticaal bewegen of van grootte veranderen tussen documenten.

Meer over Dynamische OCR

Klaar om handmatig werk
uit jouw operatie te halen?

Start gratis in een paar minuten en ontdek hoe Parseur in jouw workflow past.

Geen training van modellen nodig

Gemaakt voor echte workflows, niet voor experimenten

Schaalbaar van point-and-click tot API