Normalisation et Validation des Données
Une structure identique, des données propres à chaque document
De la définition des champs au post-traitement, chaque valeur extraite arrive propre, validée et au bon format pour vos systèmes en aval.
Ce qui est inclus
Schémas au niveau de la boîte mail
Définissez votre schéma de champs une fois pour toutes. Chaque document reçu par la boîte mail est mappé sur cette même structure, prête pour vos intégrations en aval.
- Champs simples pour les valeurs uniques, tableaux pour les listes
- Instructions en langage naturel pour guider l’IA sur chaque champ
- Modifiables à tout moment via l’interface ou l’API
Formatage par champ
Dates, nombres et adresses sont normalisés au format attendu par vos systèmes. Parseur déduit le bon format du contexte, avec valeurs par défaut configurables par boîte mail.
- Dates reconnues quel que soit l’ordre, le séparateur ou la langue
- Nombres traités avec tous séparateurs décimaux ou de milliers
- Adresses géolocalisées et découpées en éléments structurés
Validation des données
Chaque valeur extraite est validée selon le schéma défini. Les échecs apparaissent dans l’interface, déclenchent un email et un webhook pour alerter équipes et systèmes.
- Contrôle du schéma pour fiabiliser les sorties de l’IA
- Champs obligatoires signalés dès qu’une valeur manque
- Champs à choix qui rejettent toute valeur hors liste
Règles de post-traitement
Quand le formatage et la validation standards ne suffisent pas, ajoutez votre propre script Python. Les règles s’exécutent après extraction pour appliquer votre logique métier.
- Fusionnez, scindez ou créez des champs à partir des extractions
- Recherches externes ou transformations conditionnelles à la demande
- Disponible à partir du plan Pro
Comment fonctionne la normalisation des données
Ce qui vient de se passer
Parsing de documents multi-moteurs
Vision AI, Text AI, modèles ou OCR ont extrait des champs structurés de chaque document.
Mappage au schéma
Les données extraites sont rattachées au jeu de champs défini dans la boîte mail. Quel que soit le format d’origine du document, la sortie suit toujours la même structure de colonnes.
Formatage
Chaque champ est formaté automatiquement selon sa configuration. Dates et nombres sont convertis aux conventions régionales, les noms découpés en prénom, nom et surnom, et les adresses structurées.
Validation
Toutes les valeurs sont validées avant l’export. Les documents conformes passent à l’étape suivante, les autres sont mis de côté pour qu’aucune anomalie ne quitte Parseur sans être détectée.
Post-traitement
Des règles Python optionnelles s’exécutent en dernier pour appliquer votre logique métier : fusionner ou scinder des champs, faire des recherches externes ou adapter les données à vos besoins.
Ce qui se passe ensuite
Exports et intégrations en temps réel
Les données normalisées sont envoyées en temps réel à votre CRM, votre logiciel comptable ou votre base de données.