ダイナミックOCR:高度なドキュメントデータ抽出
ダイナミックOCRは、ドキュメントからデータポイントを抽出する最先端技術です。フィールドの位置やサイズがドキュメントごとに変化しても、動的に情報を検出できます。
ダイナミックOCRが必要な場面
レイアウトは似ていても、フィールドの位置やサイズが毎回異なるドキュメントには、ダイナミックOCRが真価を発揮します。
フィールドの位置が可変
テーブルやオプション項目の有無によって、フィールドの位置が毎回変わるレイアウトは少なくありません。こうしたレイアウトシフトを正確に処理できます。
-
テーブルの下にあるフィールド
- テーブルの行数が変動する場合、その下の項目の位置も大きく変わります。
-
オプション項目の後にあるフィールド
- 住所2や商品オプション(カラーやサイズなど)の有無によって、その下のデータの位置も毎回変化します。
フィールドのサイズが可変
通常、フィールドは決まったスペース内に配置されますが、コメント欄やテーブルなど、入力内容によってサイズが変わることもあります。
-
テーブルの行数が変動
- テーブル部分のデータ件数によって、フィールド(テーブル自体)の高さや範囲も変動します。抽出時にどこまでがテーブルか認識できる必要があります。
-
コメントなど可変長フィールド
- コメントや備考欄のような自由記述フィールドは、記載行数や文字数が毎回異なり、終点を正確に見極める必要があります。
ダイナミックOCRはどのように動作するか?
ダイナミックOCRは「ラベル」という基準テキストを活用します。従来のZonal OCRのように固定位置でフィールドを定めるのではなく、まずラベルに該当する文字列を検出し、そこから相対的にデータを取得します。
-
1
ラベルを作成
- フィールドの基準となるテキストをドラッグし、「ラベル作成」を選択します。
-
2
フィールド作成・ラベルと紐づけ
- 抽出したいデータ欄を選択してフィールド名を付け、まず作成したラベルを紐づけます。これでフィールドの検出はドキュメント内のラベルに基づく動的なものとなります。
-
3
クローズラベルの作成(任意)
- サイズ可変なフィールドの場合、終点となるクローズラベルも作成できます。開始ラベルからクローズラベルまでの範囲が自動的に抽出対象になります。
-
全フィールドで繰り返す
- このプロセスを全てのデータフィールドについて行うだけです。同じラベルを複数のフィールドで共有することも可能です。ラベル・フィールドともに必須・任意の設定ができます。
最もインテリジェントなドキュメント処理ソフトウェア
ダイナミックOCRなど多彩なデータ抽出機能により、Parseurはあらゆるドキュメント対応型のデータ抽出プラットフォームです。