Dynamiczny OCR: zaawansowane wyodrębnianie danych z dokumentów
Dynamiczny OCR to nasza najbardziej zaawansowana technika wyodrębniania punktów danych z dokumentów. Potrafi dynamicznie odnajdywać pola, które przesuwają się lub zmieniają rozmiar w kolejnych dokumentach.
Kiedy potrzebujesz Dynamicznego OCR?
Skorzystaj z Dynamicznego OCR, jeśli Twoje dokumenty mają podobny ogólny układ, ale poszczególne pola mogą się przesuwać lub zmieniać rozmiar w zależności od zawartości.
Pozycja pola jest zmienna
Główne przyczyny przesunięcia pól w układzie dokumentu to tabele lub opcjonalne pola. Potrafią one zmienić położenie innych elementów na stronie.
-
Pole po tabelach
- Tabele o zmiennej liczbie wierszy często powodują przesunięcie układu w sekcji znajdującej się pod nimi.
-
Po polach opcjonalnych
- Dodatkowe informacje, takie jak druga linia adresu czy pola wyboru – np. personalizacja rozmiaru lub koloru produktu – mogą przesunąć wszystkie dane znajdujące się poniżej nich.
Rozmiar pola jest zmienny
Zazwyczaj pola mieszczą się w określonym obszarze na dokumencie. Zdarza się jednak, że pole – np. pole na wieloliniowy komentarz lub tabela o zmiennej liczbie wierszy – może mieć inny rozmiar w zależności od zawartości.
-
Zmienna liczba wierszy w tabeli
- W przypadku tabel liczba wierszy może się różnić – dlatego rozmiar pola też będzie inny. Musisz wskazać narzędziu, gdzie kończy się tabela.
-
Zmienna liczba linii
- Pola na tekst swobodny – na przykład komentarze lub notatki – mogą mieć różną liczbę linijek. System do wyodrębniania danych musi prawidłowo rozpoznać, gdzie takie pole się kończy.
Jak działa Dynamiczny OCR?
Dynamiczny OCR wprowadza pojęcie etykiet. Etykieta to fragment tekstu na dokumencie, który wyznacza punkt odniesienia dla zlokalizowania pola. Zamiast ustalać pole w konkretnym miejscu na stronie, jak w przypadku Strefowego OCR, Parseur najpierw odnajduje etykietę, a następnie na jej podstawie określa położenie i rozmiar interesującego pola względem niej.
-
1
Utwórz etykietę
- Zaznacz fragment tekstu, który ma posłużyć jako punkt odniesienia i kliknij „Utwórz etykietę”.
-
2
Utwórz pole i powiąż je z etykietą
- Zaznacz dane, które chcesz wyodrębnić, nazwij pole i w opcjach wybierz utworzoną etykietę. Dzięki temu Parseur będzie wiedział, że pozycja pola jest odniesiona do wybranej etykiety.
-
3
Utwórz etykietę zamykającą (opcjonalnie)
- Jeśli pole może zmieniać rozmiar, dodaj drugą etykietę pod polem i użyj jej jako granicy końca. Parseur wykorzysta pierwszą etykietę, by znaleźć początek pola, a drugą – by oznaczyć jego zakończenie.
-
Powtarzaj
- Powtórz tę czynność dla każdego pola, które chcesz wyodrębnić! Różne pola mogą korzystać z tych samych etykiet. Zarówno etykiety, jak i pola możesz oznaczyć jako opcjonalne lub wymagane.
Najinteligentniejsze oprogramowanie do przetwarzania dokumentów
Dynamiczny OCR, w połączeniu z innymi funkcjami wyodrębniania danych, sprawia, że Parseur to najbardziej wszechstronna platforma do pracy z dokumentami.
Najlepsze w swojej klasie oprogramowanie OCR
Technologia OCR Parseur zapewnia najwyższą dokładność w branży. Obsługuje większość języków, rozpoznaje pismo odręczne i działa niezwykle szybko.
Potężny silnik szablonów
Wyodrębniaj dane z wielu różnych układów, korzystając z dowolnej liczby szablonów i automatycznego wykrywania struktury dokumentu.
Strefowy OCR
Strefowy OCR pozwala wydobywać tekst z pól, które mają niezmienne położenie na powtarzalnych dokumentach.



