ダイナミックOCR:高度なドキュメントデータ抽出

ダイナミックOCRは、ドキュメントからデータポイントを抽出する最先端技術です。フィールドの位置やサイズがドキュメントごとに変化しても、動的に情報を検出できます。

ダイナミックOCRが必要な場面

レイアウトは似ていても、フィールドの位置やサイズが毎回異なるドキュメントには、ダイナミックOCRが真価を発揮します。

フィールドの位置が可変

テーブルやオプション項目の有無によって、フィールドの位置が毎回変わるレイアウトは少なくありません。こうしたレイアウトシフトを正確に処理できます。

テーブルの下にあるフィールド

テーブルの行数が変動する場合、その下の項目の位置も大きく変わります。

オプション項目の後にあるフィールド

住所2や商品オプション(カラーやサイズなど)の有無によって、その下のデータの位置も毎回変化します。

フィールドのサイズが可変

通常、フィールドは決まったスペース内に配置されますが、コメント欄やテーブルなど、入力内容によってサイズが変わることもあります。

テーブルの行数が変動

テーブル部分のデータ件数によって、フィールド(テーブル自体)の高さや範囲も変動します。抽出時にどこまでがテーブルか認識できる必要があります。

コメントなど可変長フィールド

コメントや備考欄のような自由記述フィールドは、記載行数や文字数が毎回異なり、終点を正確に見極める必要があります。

ダイナミックOCRはどのように動作するか?

ダイナミックOCRは「ラベル」という基準テキストを活用します。従来のZonal OCRのように固定位置でフィールドを定めるのではなく、まずラベルに該当する文字列を検出し、そこから相対的にデータを取得します。

1

ラベルを作成

フィールドの基準となるテキストをドラッグし、「ラベル作成」を選択します。
2

フィールド作成・ラベルと紐づけ

抽出したいデータ欄を選択してフィールド名を付け、まず作成したラベルを紐づけます。これでフィールドの検出はドキュメント内のラベルに基づく動的なものとなります。
3

クローズラベルの作成(任意)

サイズ可変なフィールドの場合、終点となるクローズラベルも作成できます。開始ラベルからクローズラベルまでの範囲が自動的に抽出対象になります。

全フィールドで繰り返す

このプロセスを全てのデータフィールドについて行うだけです。同じラベルを複数のフィールドで共有することも可能です。ラベル・フィールドともに必須・任意の設定ができます。

最もインテリジェントなドキュメント処理ソフトウェア

ダイナミックOCRなど多彩なデータ抽出機能により、Parseurはあらゆるドキュメント対応型のデータ抽出プラットフォームです。

業界トップクラスのOCRソフトウェア

ParseurのOCRは高い認識率を誇り、多言語や手書き文書にも対応。処理速度も非常に高速です。

強力なテンプレートエンジン

多数のテンプレート作成と自動レイアウト検出機能で、複数パターンのドキュメントにも柔軟に対応します。

ゾーンOCR

ゾーンOCRを利用すれば、すべての類似ドキュメントで決まった位置にある情報だけを確実に抽出できます。

AIによるデータ抽出ソフトウェア。
今すぐParseurを始めよう。

メール、PDF、スプレッドシートからのテキスト抽出を自動化。
手作業の工数を数百時間削減。
AIによる業務自動化を体験しましょう。

Parseur rated 5/5 on Capterra
Parseur.com has the highest adoption on G2
Parseur.com has the happiest users badge on Crozdesk
Parseur rated 5/5 on GetApp
Parseur rated 4.5/5 on Trustpilot