Dynamiczny OCR: zaawansowane wyodrębnianie danych z dokumentów

Dynamiczny OCR to nasza najbardziej zaawansowana technika wyodrębniania punktów danych z dokumentów. Potrafi dynamicznie odnajdywać pola, które przesuwają się lub zmieniają rozmiar w kolejnych dokumentach.

Kiedy potrzebujesz Dynamicznego OCR?

Skorzystaj z Dynamicznego OCR, jeśli Twoje dokumenty mają podobny ogólny układ, ale poszczególne pola mogą się przesuwać lub zmieniać rozmiar w zależności od zawartości.

Pozycja pola jest zmienna

Główne przyczyny przesunięcia pól w układzie dokumentu to tabele lub opcjonalne pola. Potrafią one zmienić położenie innych elementów na stronie.

Pole po tabelach

Tabele o zmiennej liczbie wierszy często powodują przesunięcie układu w sekcji znajdującej się pod nimi.

Po polach opcjonalnych

Dodatkowe informacje, takie jak druga linia adresu czy pola wyboru – np. personalizacja rozmiaru lub koloru produktu – mogą przesunąć wszystkie dane znajdujące się poniżej nich.

Rozmiar pola jest zmienny

Zazwyczaj pola mieszczą się w określonym obszarze na dokumencie. Zdarza się jednak, że pole – np. pole na wieloliniowy komentarz lub tabela o zmiennej liczbie wierszy – może mieć inny rozmiar w zależności od zawartości.

Zmienna liczba wierszy w tabeli

W przypadku tabel liczba wierszy może się różnić – dlatego rozmiar pola też będzie inny. Musisz wskazać narzędziu, gdzie kończy się tabela.

Zmienna liczba linii

Pola na tekst swobodny – na przykład komentarze lub notatki – mogą mieć różną liczbę linijek. System do wyodrębniania danych musi prawidłowo rozpoznać, gdzie takie pole się kończy.

Jak działa Dynamiczny OCR?

Dynamiczny OCR wprowadza pojęcie etykiet. Etykieta to fragment tekstu na dokumencie, który wyznacza punkt odniesienia dla zlokalizowania pola. Zamiast ustalać pole w konkretnym miejscu na stronie, jak w przypadku Strefowego OCR, Parseur najpierw odnajduje etykietę, a następnie na jej podstawie określa położenie i rozmiar interesującego pola względem niej.

1

Utwórz etykietę

Zaznacz fragment tekstu, który ma posłużyć jako punkt odniesienia i kliknij „Utwórz etykietę”.
2

Utwórz pole i powiąż je z etykietą

Zaznacz dane, które chcesz wyodrębnić, nazwij pole i w opcjach wybierz utworzoną etykietę. Dzięki temu Parseur będzie wiedział, że pozycja pola jest odniesiona do wybranej etykiety.
3

Utwórz etykietę zamykającą (opcjonalnie)

Jeśli pole może zmieniać rozmiar, dodaj drugą etykietę pod polem i użyj jej jako granicy końca. Parseur wykorzysta pierwszą etykietę, by znaleźć początek pola, a drugą – by oznaczyć jego zakończenie.

Powtarzaj

Powtórz tę czynność dla każdego pola, które chcesz wyodrębnić! Różne pola mogą korzystać z tych samych etykiet. Zarówno etykiety, jak i pola możesz oznaczyć jako opcjonalne lub wymagane.

Najinteligentniejsze oprogramowanie do przetwarzania dokumentów

Dynamiczny OCR, w połączeniu z innymi funkcjami wyodrębniania danych, sprawia, że Parseur to najbardziej wszechstronna platforma do pracy z dokumentami.

Najlepsze w swojej klasie oprogramowanie OCR

Technologia OCR Parseur zapewnia najwyższą dokładność w branży. Obsługuje większość języków, rozpoznaje pismo odręczne i działa niezwykle szybko.

Potężny silnik szablonów

Wyodrębniaj dane z wielu różnych układów, korzystając z dowolnej liczby szablonów i automatycznego wykrywania struktury dokumentu.

Strefowy OCR

Strefowy OCR pozwala wydobywać tekst z pól, które mają niezmienne położenie na powtarzalnych dokumentach.

Oprogramowanie do ekstrakcji danych opartych na AI.
Zacznij korzystać z Parseur już dziś.

Automatyzuj wyodrębnianie tekstu z e-maili, PDF-ów i arkuszy kalkulacyjnych.
Oszczędzaj setki godzin ręcznej pracy.
Postaw na automatyzację pracy z AI.

Parseur rated 5/5 on Capterra
Parseur.com has the highest adoption on G2
Parseur.com has the happiest users badge on Crozdesk
Parseur rated 5/5 on GetApp
Parseur rated 4.5/5 on Trustpilot