Zonal OCR:簡単にドキュメントを構造化データへ変換
Zonal OCRは従来の光学式文字認識(OCR)より一歩進んだ機能を持ちます。ドキュメントページ上の特定の場所(「ゾーン」)からテキストを抽出できます。Zonal OCRは、OCRで抽出された生のドキュメント内容を構造化データに変換する最もシンプルな方法です。
Zonal OCRはどのように機能するのか?
Parseurを使ったZonal OCRの利用はとても簡単で直感的です。必要なテキストフィールドを数ステップで素早く作成できます。
-
1
ページ上にゾーンを描画する
- 抽出したいテキスト部分を見つけて、マウスでその箇所にボックスを描きます。
-
2
フィールドに名前を付ける
- 「Create Field」ボタンをクリックし、新しく作成したフィールドにわかりやすい名前を設定します。
-
3
フィールドオプションを設定
- 必要に応じて日付や住所、連絡先名などのフォーマット・必須設定など、フィールドオプションをカスタマイズできます。
-
繰り返し
- 必要なフィールドごとにこの操作を繰り返してください。Parseurはレイアウトが同じ書類をアップロードするたびに、指定したゾーンから自動的にデータを抽出します。
OCRとZonal OCRの違い
Zonal OCRは従来のOCR技術よりも進化しています。文書全体を単にテキスト化するだけでなく、業務で使いやすい構造化データを抽出できます。
従来型OCR
ドキュメントをプレーンテキストに変換

通常のOCRはドキュメント内の全テキストを識別し、プレーンテキストに変換します。
従来型OCRは内容のインデックス化や検索性の向上には役立ちますが、抽出されたデータは構造化されていないため、他のシステムでの活用は難しくなります。
Zonal OCR
ドキュメントを構造化データに変換

Zonal OCRはページ上で指定したエリア(ゾーン)からのみテキストを抽出し、JSONなどの構造化データとして出力します。
Zonal OCRは非構造的な書類から構造化データに変換するのに理想的です。視覚的にゾーンを設定できるため、誰でも簡単に使い始めることができます。
Zonal OCRは使うべき?メリット・デメリット
Zonal OCRは書類から構造化データを抽出する最もシンプルな方法です。ただし、実際の利用シーンに応じた制限もあります。
Zonal OCRのメリット
-
✅
細かなコントロール
- Zonal OCRでは必要なデータのみを指定し、フィールド名やデータの標準化(日付・数値・住所など)も業務にあわせて柔軟に設定できます。
-
✅
セットアップが簡単
- 欲しい情報の位置にボックスを描くだけなので、複雑な解析ルールや正規表現を作成する必要はありません。
-
✅
簡単なデバッグと調整
- Zonal OCRの抽出結果は視覚的にわかりやすく、ズレや抜けなど課題があっても、文書上のゾーンをすぐに微調整できます。
Zonal OCRの制限
-
❌
動的なフィールドへの非対応
- 設計上、Zonal OCRは書類上で場所が変化しないデータのみ抽出可能です。各書類でフィールド位置が動く場合、誤ったデータが抽出されるリスクがあります。
-
❌
可変サイズフィールドへの非対応
- Zonal OCRのゾーンは幅と高さが固定のため、内容によって行数が変化する住所や表データなどの抽出には向きません。
-
❌
低品質スキャン書類での利用制限
- 画質が低いスキャンデータでは、ページごとに縮尺や向きが異なりゾーンが正しく合致しないことがあり、正確な抽出が難しいケースがあります。
動的OCRによるインテリジェントなデータ抽出
Parseurの高度なOCR機能は、Dynamic OCRや複数テンプレート対応、自動レイアウト検出によってZonal OCRの課題を解決します。