ダイナミックOCR：高度なドキュメントデータ抽出

ダイナミックOCRは、ドキュメントからデータポイントを抽出する最先端技術です。フィールドの位置やサイズがドキュメントごとに変化しても、動的に情報を検出できます。

ダイナミックOCRが必要な場面

レイアウトは似ていても、フィールドの位置やサイズが毎回異なるドキュメントには、ダイナミックOCRが真価を発揮します。

テーブルやオプション項目の有無によって、フィールドの位置が毎回変わるレイアウトは少なくありません。こうしたレイアウトシフトを正確に処理できます。

通常、フィールドは決まったスペース内に配置されますが、コメント欄やテーブルなど、入力内容によってサイズが変わることもあります。

テーブルの行数が変動: テーブル部分のデータ件数によって、フィールド（テーブル自体）の高さや範囲も変動します。抽出時にどこまでがテーブルか認識できる必要があります。
コメントなど可変長フィールド: コメントや備考欄のような自由記述フィールドは、記載行数や文字数が毎回異なり、終点を正確に見極める必要があります。

ダイナミックOCRは「ラベル」という基準テキストを活用します。従来のZonal OCRのように固定位置でフィールドを定めるのではなく、まずラベルに該当する文字列を検出し、そこから相対的にデータを取得します。

1 ラベルを作成: フィールドの基準となるテキストをドラッグし、「ラベル作成」を選択します。
2 フィールド作成・ラベルと紐づけ: 抽出したいデータ欄を選択してフィールド名を付け、まず作成したラベルを紐づけます。これでフィールドの検出はドキュメント内のラベルに基づく動的なものとなります。
3 クローズラベルの作成（任意）: サイズ可変なフィールドの場合、終点となるクローズラベルも作成できます。開始ラベルからクローズラベルまでの範囲が自動的に抽出対象になります。
全フィールドで繰り返す: このプロセスを全てのデータフィールドについて行うだけです。同じラベルを複数のフィールドで共有することも可能です。ラベル・フィールドともに必須・任意の設定ができます。

ダイナミックOCRなど多彩なデータ抽出機能により、Parseurはあらゆるドキュメント対応型のデータ抽出プラットフォームです。

ParseurのOCRは高い認識率を誇り、多言語や手書き文書にも対応。処理速度も非常に高速です。

多数のテンプレート作成と自動レイアウト検出機能で、複数パターンのドキュメントにも柔軟に対応します。

ゾーンOCRを利用すれば、すべての類似ドキュメントで決まった位置にある情報だけを確実に抽出できます。

ドキュメントデータ抽出、
そろそろ自動化しませんか？

数分で設定完了。Parseurがどう業務フローに収まるか、無料でお試しいただけます。

AIモデルの学習は不要

あらゆるドキュメントからのデータ入力を自動化

クリック操作からAPIまで柔軟に対応