データ正規化とバリデーション
どのドキュメントからも、同じ形の整ったデータを
メールボックスのスキーマから抽出後処理まで、すべての値が整形・検証され、連携先システムでそのまま使える状態で届きます。
含まれる内容
メールボックス単位のスキーマ
一度フィールドを定義すれば、そのメールボックスで処理されるすべてのドキュメントが同じ構造にマッピングされ、連携先での扱いも安定します。
- 単一値は通常フィールド、繰り返しはテーブル
- 抽出内容は自然言語の指示でAIに伝達
- 画面またはAPIからいつでも調整可能
フィールド単位の整形
組み込みの整形機能で、日付・数値・住所などを自動で標準化。書式はドキュメントの文脈とメールボックスの既定値から判定します。
- 日付は順序・区切り・月名表記の差を自動解釈
- 数値は各国の小数点や桁区切りに対応
- 住所は緯度経度を付与し構造化要素へ分解
データバリデーション
抽出されたすべての値をスキーマで検証。不備は画面上で確認でき、メールやWebhookでも通知できるため、運用の見落としを防げます。
- スキーマ検証でAIの出力形式を確認
- 必須フィールドの欠落をすぐ検知
- 選択肢フィールドの範囲外を警告
後処理ルール
標準の整形と検証に加え、Pythonスクリプトで独自の処理を追加できます。値の加工も業務要件に合わせた検証も柔軟に組み込めます。
- 値の結合・分割や新規フィールドの算出
- 独自ロジックや外部データとの照合に対応
- プロプラン以上でご利用いただけます
データ正規化はこう動きます
直前のステップ
マルチエンジンによるドキュメント解析
Vision AI、Text AI、テンプレート、またはOCRが、各ドキュメントから構造化フィールドを抽出した状態です。
スキーマにマッピング
抽出された値は、メールボックスで定義した固定のフィールド構成にマッピングされます。レイアウトや差出人が違うドキュメントでも、出力は常に同じカラム構造に揃います。
整形
各フィールドは設定した書式に標準化されます。日付や数値は表記の地域差を吸収して整え、氏名や住所は自動で構成要素に分解されます。
検証
すべての値をバリデーションで検証します。不合格のドキュメントはParseur上で即座にフラグが立ち、後処理には進みません。通過した値だけが次の工程へ送られます。
後処理
必要に応じてPythonルールを実行し、単一フィールドでは表現できない業務ロジックや複雑な変換を適用します。値の結合、参照データとの照合、出力整形まで自由に組み立てられます。
次のステップ
リアルタイム連携とエクスポート
整ったデータがリアルタイムでCRM、会計、ERP、データベースへ自動で配信されます。