Normalizacja i walidacja danych
Spójna struktura i czyste dane z każdego dokumentu
Od schematu skrzynki po reguły końcowe — każde pole trafia do Twoich systemów uporządkowane, zwalidowane i gotowe do użycia.
Co jest w zestawie
Schematy na poziomie skrzynki
Definiujesz pola raz na poziomie skrzynki. Każdy dokument przetworzony w tej skrzynce zwraca dokładnie tę samą strukturę danych, gotową do dalszej automatyzacji.
- Pola standardowe i pola tabeli dla danych wierszowych.
- Instrukcje w języku naturalnym mówią AI, co wyodrębnić.
- Edycja pól w interfejsie lub programowo przez API.
Formatowanie na poziomie pola
Wbudowane formaty normalizują daty, liczby, imiona i adresy. Format rozpoznawany jest z kontekstu dokumentu, a ustawienia skrzynki działają jako zabezpieczenie.
- Daty rozpoznawane w dowolnym układzie i języku.
- Liczby z dowolnym separatorem dziesiętnym i tysięcznym.
- Adresy rozbijane automatycznie na ulicę, miasto, kod i kraj.
Walidacja danych
Każda wartość jest sprawdzana względem schematu skrzynki. Błędne pola widać w interfejsie, lecą też e-mailem i webhookiem do Twoich systemów operacyjnych.
- Kontrola typu pola wyłapuje wartości niezgodne ze schematem.
- Pola wymagane wychwytują braki, zanim dane pójdą dalej.
- Pola wyboru oznaczają wartości spoza dozwolonej listy.
Reguły post-processingu
Gdy standardowe formaty nie wystarczą, dopisujesz krótki skrypt w Pythonie. Uruchamia się po ekstrakcji i pozwala przekształcać wartości według logiki biznesowej.
- Łącz, dziel lub wylicz nowe pola z istniejących wartości.
- Stosuj warunki, odwołania i własną logikę biznesową.
- Funkcja dostępna w planie Pro i wyższych.
Jak działa normalizacja danych
Co właśnie się wydarzyło
Wielosilnikowe przetwarzanie dokumentów
Vision AI, Text AI, szablony lub OCR wyodrębniły ustrukturyzowane pola z każdego dokumentu.
Mapowanie do schematu
Wyekstrahowane wartości zostają przyporządkowane do ustalonego zestawu pól przypisanego do skrzynki. Bez względu na oryginalny układ dokumentu, wszystkie dane trafiają do tego samego strukturalnego zestawu na wyjściu.
Formatowanie
Każde pole trafia przez skonfigurowany format. Daty i liczby normalizowane są według różnych regionalnych wariantów w oparciu o kontekst dokumentu, imiona są rozdzielane na części, a adresy rozbijane na strukturalne komponenty.
Walidacja
Każda uzyskana wartość jest poddawana walidacji zgodnie z ustalonym schematem, zanim trafi do kolejnego etapu. Dokumenty z błędami są odpowiednio oznaczane, tak by żaden przypadek nie umknął uwadze w Parseur.
Post-processing
Opcjonalne reguły w Pythonie uruchamiane są na końcu i służą realizacji niestandardowej logiki biznesowej, której nie da się wyrazić przez samo ustawienie formatu pola. Możesz łączyć dane, korzystać z pól referencyjnych i precyzyjnie kształtować wynik pod systemy docelowe.
Co dzieje się dalej
Eksporty i integracje w czasie rzeczywistym
Znormalizowane dane przesyłane są w czasie rzeczywistym do Twojego CRM, systemu księgowości lub bazy danych.