Den mest exakta OCR-mjukvaran
Parseur använder den senaste AI- och maskininlärningsteknologin för att känna igen text från dokument med högsta noggrannhet. Vår motor har redan behandlat miljontals sidor inom många branscher, inklusive finans, försäkring, fastigheter, logistik och e-handel.
OCR är grunden för datautvinning
Optisk teckenigenkänning (OCR) är tekniken som gör det möjligt för datorer att känna igen och extrahera text automatiskt från dokument. En högpresterande OCR-mjukvara är grunden för pålitliga arbetsflöden för datautvinning. Parseurs OCR-motor använder avancerat datorseende och Natural Language Processing (NLP) med modeller tränade på marknadens största datasets.
OCR för alla
Vår motor låter dig identifiera text från samtliga dokumenttyper.
-
Textbaserade PDF-filer
- Läs av text direkt från PDF:ers textlager (när det finns). Sådana PDF:er kallas även “sökbara PDF:er” eller PDF/A och är vanliga i företagsmiljöer.
-
Skannade PDF-filer
- För PDF:er som endast innehåller bilder, identifierar Parseur text genom datorseende för högsta noggrannhet.
-
E-post och textdokument
- Fånga text från e-post (inklusive HTML-mejl med bilder och länkar) och andra rena textdokument med maximal träffsäkerhet.
-
Kalkylblad och mer
- Parseur kan även extrahera text från kalkylblad (Excel, CSV), Word-filer, webbsidor och mycket mer. Se den kompletta listan över filtyper som stöds.
Stöd för de flesta språk
Omfattande träningsdata är grunden till en exakt OCR-mjukvara. Vår OCR-motor förbättras kontinuerligt tack vare växande språkdatamängder från hela världen.-
60+ språk stöds
- Vår OCR-mjukvara är omfattande tränad och kan identifiera text på över 60 språk, inklusive engelska, spanska, franska, tyska, nederländska, ryska, japanska, koreanska, kinesiska, hebreiska, arabiska, hindi och många fler. Dessutom finns experimentellt stöd för ytterligare över 160 språk.
-
Handskriftsigenkänning
- Parseur kan tolka handskriven text på latinska, japanska och koreanska alfabeten, samt har experimentellt stöd för handskrift på bland annat kinesiska, grekiska, kyrilliska och vietnamesiska.
Gå bortom OCR
OCR omvandlar dina dokument till rå, ostrukturerad textdata. Denna grundinformation kan sedan förädlas i vår visuella Point & Click-mallredigerare samt genom pipelines för Zonal OCR och Dynamisk OCR, vilket ger mycket tillförlitlig och strukturerad data.
Kraftfullt mallhanteringssystem
Extrahera data från olika layouter genom att skapa flera mallar och intelligent layoutigenkänning.
Zonal OCR
Med Zonal OCR extraherar du text från fält som alltid ligger på samma position i snarlika dokument.
Dynamisk OCR
Med Dynamisk OCR kan du smidigt extrahera text från fält som förflyttas eller ändrar storlek mellan olika dokument.