De meest nauwkeurige OCR-software
Parseur maakt gebruik van de nieuwste AI- en machine learning-technologieën om tekst uit documenten te herkennen met de hoogste nauwkeurigheid. Onze engine heeft al miljoenen pagina's verwerkt in allerlei sectoren, waaronder financiën, verzekeringen, vastgoed, logistiek en e-commerce.
OCR is de basis van gegevens-extractie
Optical Character Recognition is de technologie die computers in staat stelt tekst uit documenten te herkennen en te extraheren. Een nauwkeurige OCR-engine vormt de kern van ieder betrouwbaar gegevens-extractieproces. De OCR-engine van Parseur gebruikt Computer Vision en Natural Language Processing (NLP), met modellen getraind op de grootste datasets die beschikbaar zijn.
OCR voor iedereen
Onze engine maakt het mogelijk om tekst uit vrijwel alle documenttypen te herkennen.
-
Tekstgebaseerde PDF's
- Herken tekst uit de tekstlaag van PDF's (wanneer aanwezig). Deze doorzoekbare PDF's, ook wel PDF/A genoemd, komen veel voor en zijn eenvoudig te verwerken.
-
Gescande PDF's
- Voor gescande PDF-bestanden die enkel uit afbeeldingen bestaan, past Parseur geavanceerde Computer Vision toe om tekst nauwkeurig te herkennen en te extraheren.
-
E-mails en tekstbestanden
- Herken tekst in e-mails (inclusief opgemaakte e-mails, afbeeldingen en links) en andere tekstbestanden met volledige nauwkeurigheid.
-
Spreadsheets en meer
- Parseur herkent ook tekst in spreadsheets (Excel, CSV), Word-documenten, webpagina's en meer. Bekijk de volledige lijst van ondersteunde bestandsformaten.
Ondersteunt de meeste talen
Grote, diverse trainingsdatasets zijn essentieel voor een zeer nauwkeurige OCR-engine. Onze engine wordt voortdurend doorontwikkeld met actuele, taalspecifieke datasets van over de hele wereld.-
Meer dan 60 talen ondersteund
- Onze OCR-software is uitgebreid getraind op meer dan 60 talen, waaronder Engels, Spaans, Frans, Duits, Nederlands, Russisch, Japans, Koreaans, Chinees, Hebreeuws, Arabisch, Hindi en meer. Daarnaast bieden we experimentele ondersteuning voor ruim 160 andere talen.
-
Herken handschrift
- Parseur kan handgeschreven tekst herkennen in het Latijnse, Japanse en Koreaanse schrift. Er is tevens experimentele ondersteuning voor handschrift in bijvoorbeeld Chinees, Grieks, Cyrillisch en Vietnamees.
Ga verder dan alleen OCR
OCR zet documenten om in ruwe, ongestructureerde tekst. Deze ruwe data kan vervolgens verder verwerkt worden in onze visuele Point & Click-template editor, of via onze Zonale en Dynamische OCR-pijplijnen, om zeer betrouwbare gestructureerde gegevens te genereren.
Krachtige template-engine
Extraheer data uit verschillende layoutvarianten door meerdere templates aan te maken en automatische layoutdetectie te gebruiken.
Zonale OCR
Met Zonale OCR haal je tekst uit velden die altijd op dezelfde positie staan in soortgelijke documenten.
Dynamische OCR
Met Dynamische OCR kun je eenvoudig tekst extraheren uit velden die horizontaal, verticaal bewegen of van grootte veranderen tussen documenten.