Daten-Normalisierung und Validierung
Einheitliche Felder, geprüfte Daten aus jedem Dokument
Vom Postfach-Schema bis zur Nachverarbeitung kommt jeder Wert sauber, validiert und im richtigen Format in Ihren Folgesystemen an.
Was enthalten ist
Schema auf Postfach-Ebene
Sie definieren Ihre Felder einmal pro Postfach. Jedes Dokument wird auf dieselbe Struktur abgebildet, unabhängig von Layout oder Absender, damit Ihre Folgesysteme stets stabile Datensätze erhalten.
- Standardfelder für Einzelwerte, Tabellenfelder für Wiederholungen
- Felder in natürlicher Sprache an die KI beschreiben
- Anpassbar in der Oberfläche oder per API
Formate auf Feldebene
Eingebaute Formate normalisieren Datumsangaben, Zahlen, Namen und Adressen. Das passende Format wird aus dem Dokumentkontext erkannt, die Postfach-Einstellungen dienen dabei als Fallback.
- Datumsangaben aus jedem Format, jeder Schreibweise und jeder Sprache
- Zahlen unabhängig von Dezimal- oder Tausendertrenner korrekt erkannt
- Adressen in strukturierte Komponenten zerlegt und geolokalisiert
Datenvalidierung
Jeder Wert wird gegen das Postfach-Schema geprüft. Fehler erscheinen in der Oberfläche, lösen eine E-Mail-Benachrichtigung aus und triggern zusätzlich einen Webhook.
- Schema-Prüfung sichert, dass KI-Ergebnisse zur Feldstruktur passen
- Pflichtfeldprüfung erkennt fehlende Werte unmittelbar
- Optionsfeldprüfung meldet Werte außerhalb der erlaubten Auswahl
Nachverarbeitungsregeln
Wenn Standardformate nicht ausreichen, steuern Sie mit kleinen Python-Skripten gezielt nach. Die Regeln laufen nach der Extraktion und passen jedes Feld exakt an Ihre Vorgaben an.
- Werte zusammenführen, trennen oder zu neuen Feldern berechnen
- Geschäftslogik, Nachschlagetabellen und bedingte Logik anwenden
- Verfügbar ab dem Pro-Tarif
So funktioniert die Daten-Normalisierung
Was gerade passiert ist
Multi-Engine Dokumenten-Parsing
Vision-AI, Text-AI, Vorlagen oder OCR haben strukturierte Felder aus jedem Dokument extrahiert.
Abbildung auf das Schema
Jeder extrahierte Wert wird auf die im Postfach festgelegte Feldstruktur abgebildet. Egal welches Layout das Dokument hat, das Ergebnis ist immer einheitlich strukturiert.
Formatieren
Jedes Feld wird gemäß seinem konfigurierten Format verarbeitet. Datumsangaben und Zahlen werden regional korrekt normalisiert, Namen in Vor-, Mittel- und Nachname zerlegt, Adressen strukturiert aufgeschlüsselt.
Validieren
Alle Ergebnisse durchlaufen Validierungsprüfungen, bevor sie weitergehen. Nur Dokumente, die diesen Check bestehen, werden exportiert, alle anderen werden markiert und zur Prüfung zurückgehalten.
Nachverarbeitung
Bei Bedarf setzen Sie Python-Regeln ein, um komplexe Geschäftslogik oder individuelle Anforderungen umzusetzen. Felder lassen sich kombinieren, Referenzdaten abfragen und Strukturen exakt an Ihre Zielsysteme anpassen.
Was als Nächstes passiert
Echtzeit-Exporte und Integrationen
Normalisierte Daten gehen in Echtzeit an Ihr CRM, Ihre Buchhaltung oder Ihre Datenbank.