Den mest exakta OCR-mjukvaran

Parseur använder den senaste AI- och maskininlärningsteknologin för att känna igen text från dokument med högsta noggrannhet. Vår motor har redan behandlat miljontals sidor inom många branscher, inklusive finans, försäkring, fastigheter, logistik och e-handel.

OCR är grunden för datautvinning

Optisk teckenigenkänning (OCR) är tekniken som gör det möjligt för datorer att känna igen och extrahera text automatiskt från dokument. En högpresterande OCR-mjukvara är grunden för pålitliga arbetsflöden för datautvinning. Parseurs OCR-motor använder avancerat datorseende och Natural Language Processing (NLP) med modeller tränade på marknadens största datasets.

OCR för alla

Vår motor låter dig identifiera text från samtliga dokumenttyper.

Textbaserade PDF-filer

Läs av text direkt från PDF:ers textlager (när det finns). Sådana PDF:er kallas även “sökbara PDF:er” eller PDF/A och är vanliga i företagsmiljöer.

Skannade PDF-filer

För PDF:er som endast innehåller bilder, identifierar Parseur text genom datorseende för högsta noggrannhet.

E-post och textdokument

Fånga text från e-post (inklusive HTML-mejl med bilder och länkar) och andra rena textdokument med maximal träffsäkerhet.

Kalkylblad och mer

Parseur kan även extrahera text från kalkylblad (Excel, CSV), Word-filer, webbsidor och mycket mer. Se den kompletta listan över filtyper som stöds.

Stöd för de flesta språk

Omfattande träningsdata är grunden till en exakt OCR-mjukvara. Vår OCR-motor förbättras kontinuerligt tack vare växande språkdatamängder från hela världen.

60+ språk stöds

Vår OCR-mjukvara är omfattande tränad och kan identifiera text på över 60 språk, inklusive engelska, spanska, franska, tyska, nederländska, ryska, japanska, koreanska, kinesiska, hebreiska, arabiska, hindi och många fler. Dessutom finns experimentellt stöd för ytterligare över 160 språk.

Handskriftsigenkänning

Parseur kan tolka handskriven text på latinska, japanska och koreanska alfabeten, samt har experimentellt stöd för handskrift på bland annat kinesiska, grekiska, kyrilliska och vietnamesiska.

Gå bortom OCR

OCR omvandlar dina dokument till rå, ostrukturerad textdata. Denna grundinformation kan sedan förädlas i vår visuella Point & Click-mallredigerare samt genom pipelines för Zonal OCR och Dynamisk OCR, vilket ger mycket tillförlitlig och strukturerad data.

Kraftfullt mallhanteringssystem

Extrahera data från olika layouter genom att skapa flera mallar och intelligent layoutigenkänning.

Zonal OCR

Med Zonal OCR extraherar du text från fält som alltid ligger på samma position i snarlika dokument.

Dynamisk OCR

Med Dynamisk OCR kan du smidigt extrahera text från fält som förflyttas eller ändrar storlek mellan olika dokument.

Kom igång

Redo att få bort det manuella arbetet
ur er verksamhet?

Skapa ett gratis konto på några minuter och se hur Parseur kan förenkla ert arbetsflöde.

Ingen modellträning krävs
Byggt för verkliga arbetsflöden, inte för experiment
Från enkelt gränssnitt till full API-integration