OCR Dynamique : extraction de données avancée
L'OCR Dynamique est notre technologie la plus avancée pour extraire des données de documents. Elle permet de capturer dynamiquement les champs qui changent de position ou de taille d'un document à l'autre.
Quand utiliser l'OCR Dynamique ?
L'OCR Dynamique est idéale pour les documents dont la mise en page est similaire, mais où certains champs peuvent changer de position ou de taille.
Position variable des champs
Les tableaux ou les champs optionnels sont les principales causes de décalage de mise en page, ce qui entraîne le déplacement des champs dans un document.
-
Champs après les tableaux
- Les tableaux avec un nombre variable de lignes entraînent souvent un décalage de la mise en page en dessous d'eux.
-
Champs après des éléments optionnels
- Les informations optionnelles, comme une ligne "adresse 2" dans une adresse ou une option de personnalisation (taille ou couleur d'un article), peuvent également entraîner un décalage des informations suivantes.
Taille variable des champs
Vos champs sont souvent limités à une zone fixe sur le document. Mais parfois, ce n'est pas le cas, par exemple pour les commentaires multilignes ou les tableaux à plusieurs lignes.
-
Nombre variable de lignes dans les tableaux
- Le nombre de lignes dans les tableaux pouvant varier, la taille du champ du tableau changera également. Vous devez pouvoir indiquer à l'outil où le tableau se termine.
-
Nombre variable de lignes de texte
- Les champs qui capturent du texte libre, comme des commentaires ou des notes, peuvent s'étendre sur un nombre variable de lignes. Votre outil d'extraction de données doit être capable de déterminer où le champ s'arrête.
Comment fonctionne l'OCR Dynamique ?
L'OCR Dynamique utilise le concept d'étiquettes. Une étiquette est un élément de texte sur le document qui sert d'ancre pour positionner votre champ. Au lieu d'avoir un champ à une position fixe sur la page comme dans l'OCR Zonal, Parseur commence par localiser l'étiquette, puis utilise sa position pour localiser le champ par rapport à celle-ci.
-
1
Créer une étiquette
- Dessinez une boîte sur l'élément de texte que vous souhaitez utiliser comme ancre, puis cliquez sur "Créer une étiquette".
-
2
Créer un champ et le relier à l'étiquette
- Dessinez une boîte sur les données que vous souhaitez capturer, nommez le champ et sélectionnez l'étiquette que vous avez créée dans les options pour indiquer à Parseur que la position du champ n'est pas fixe, mais relative à la position de l'étiquette.
-
3
Créer une étiquette de fermeture (facultatif)
- Si la taille de votre champ peut varier, vous pouvez également créer une deuxième étiquette en dessous du champ et l'utiliser comme étiquette de fermeture. Parseur utilisera votre première étiquette pour trouver le début du champ et la deuxième étiquette pour en déterminer la fin.
-
Répéter
- Répétez l'opération pour chaque champ, et vous avez terminé. Différents champs peuvent partager les mêmes étiquettes. Les étiquettes, comme les champs, peuvent être déclarées facultatives ou obligatoires.
Le logiciel de traitement de documents le plus intelligent
L'OCR Dynamique, combinée à nos autres fonctionnalités d'extraction de données, fait de Parseur la plateforme la plus polyvalente pour extraire des données de vos documents.
Le meilleur logiciel OCR du marché
Parseur offre une précision OCR inégalée sur le marché. Il prend en charge la plupart des langues, y compris l'écriture manuscrite, et est incroyablement rapide.
Un moteur de modèles puissant
Extrayez les données de différentes mises en page en créant plusieurs modèles et en utilisant la détection automatique de la mise en page.
OCR Zonal
L'OCR Zonal permet d'extraire le texte des champs qui se trouvent à une position fixe sur chaque document similaire.