マルチエンジンによるドキュメント解析

あらゆる書類に最適な解析エンジン

レイアウト重視ならVision AI、テキスト中心ならText AI、定型書式ならテンプレート。3つのエンジンが同じメールボックスで連携し、書類ごとに最適な方法を自動で選びます。

含まれる内容

Vision AIによる抽出

Visionモデルは書類を画像として丸ごと読み取り、レイアウトや視覚的な文脈を人間の目線で理解します。複雑なPDFやスキャン書類からでも、必要なデータを正確に取り出せます。

  • レイアウトが複雑なPDF、スキャン、帳票に最適
  • 手書き、チェックボックス、スタンプ、配置依存の項目も抽出
  • 英語で指示を書くだけ。テンプレートは不要

Text AIによる抽出

書類からテキストだけを取り出し、AIがその文章を解析します。レイアウトや画像情報は使わず、テキストの内容そのものから必要な値を取り出す方式です。

  • メールやプレーンなPDFなどテキスト中心の書類に最適
  • レイアウトに情報価値がないケースで有効
  • 英語で指示を書くだけ。テンプレートは不要

テンプレートによる抽出

必要な数だけテンプレートを用意でき、Parseurが書類ごとに最適なテンプレートを自動で選択します。同じレイアウトには常に同じ出力。AIは使いません。

  • 定型フォームや自動配信メールなどに最適
  • レイアウトが完全に一致する書類で最も信頼性が高い方式
  • テンプレートはビジュアルエディタで直感的に設定

テーブル・明細行の抽出

表の各行をそれぞれ独立したデータレコードとして取り出します。1つのフィールドにまとめず、行ごとに分けて出力。全エンジンで利用でき、スプレッドシートは自動で解析されます。

  • 書類ごとに行数が変わっても柔軟に対応
  • 複数ページにまたがる表も最後まで抽出
  • AIエンジンなら複雑な明細も列ごとに分割

スキャン・画像書類向けOCR

OCR(光学文字認識)が、スキャン、スマホ撮影、画像PDFなどテキスト層のない書類からテキストを取り出します。取り出したテキストはText AIやテンプレートエンジンが解析します。

  • スキャン、スマホ写真、画像PDFまで幅広く対応
  • 手書きを含む200以上の言語に対応する多言語OCR
  • 固定・可変レイアウトの両方に効くゾーンOCRと動的OCR

書類の事前処理

Parseurは抽出の前に受信書類を自動でクリーンアップ・修復します。1億件以上の実書類で鍛え上げられた処理が、抽出精度を底上げします。

  • 傾いたスキャンを補正し、文字化けは再OCRで復元
  • 破損したPDF、壊れた文字コード、不正なHTMLも自動修復
  • 各国独自フォーマットの日付や数値も自動で判別

ドキュメント解析の仕組み

直前のステップ

ドキュメントの取り込み

書類はアップロード、もしくはメール、API、ストレージ連携経由で自動的に受信されます。

詳細を見る
1

事前処理

書類ごとに自動でクリーンアップ。ページの傾きを補正し、文字化けや崩れた文字列も修復します。

9° 傾き
準備完了
2

OCR

スキャン、写真、画像PDFはOCRでテキスト化。すでにテキスト層がある書類はこの工程をスキップします。

請求書 #Q2-8821
アクメ株式会社
April 15, 2026
期限 May 15
差出人
アクメ株式会社
acme.co.jp
請求先
グローベックス株式会社
東京
OCRスキャン中
3

最適エンジンの選択

Parseurが書類の中身を見て最適なエンジンを自動で選びます。一致するテンプレートがあればそれを優先、なければ画像中心はVision AI、テキスト中心はText AIが処理します。

テンプレート
AI画像認識
AIテキスト
4

抽出

選ばれたエンジンが定義済みスキーマに沿って構造化フィールドを抽出。続いて正規化フェーズでフォーマット統一と検証を行います。

請求書 #Q2-8821 請求番号
アクメ株式会社
顧客
5月 14, 2026
日付
期限 May 15
差出人
アクメ株式会社
acme.co.jp
請求先
グローベックス株式会社
東京
明細 項目 数量 金額 コンサルティング 2 ¥5,500 機材 1 ¥2,800 初期設定費用 3 ¥8,000
小計 ¥16,300
消費税 ¥1,700
合計 ¥18,000 合計
抽出中

次のステップ

データの正規化と検証

抽出されたフィールドは検証・整形され、後続のワークフローでそのまま使える形になります。

詳細を見る
はじめよう

ドキュメント解析を、まるごと自動化。

サンプルをアップロードして、抽出したい項目名を指定するだけ。Vision AI・Text AI・テンプレートが自動でデータ化します。

無料プランあり、クレジットカード不要
最初のドキュメントは2分以内に処理開始
契約期間の縛りなし、いつでも解約可能

よくあるご質問

Parseurのマルチエンジン解析(Vision AI、OCR、テンプレート、テーブル抽出、多言語対応)について、よくいただくご質問をまとめました。

ドキュメント解析とは、PDF、スキャン、メールなど非構造化の書類から、スプレッドシートやデータベースで扱える構造化データを自動で取り出す処理のことです。ParseurはVision AI、Text AI、テンプレートの3つのエンジンから最適な方法を自動で選び、効率よく抽出します。

Vision AIはページを画像として解析し、手書き、チェックボックス、スタンプといった視覚的な手がかりも含めてレイアウト全体を読み取ります。複雑なPDFや帳票に向いています。Text AIはレイアウトを使わずテキストだけを解析する方式で、メール本文やシンプルなPDFなどテキスト中心の書類に最適です。

はい、可能です。レイアウトごとに必要なだけテンプレートを追加でき、新しい書類が届くたびに最適なテンプレートが自動で選ばれます。レイアウトの違う書類も1つのメールボックスでまとめて運用できます。一致するテンプレートが見つからない場合は、Vision AIやText AIに自動で切り替わります。

はい。スキャン、スマホ写真、画像のみのPDFはOCRでテキスト化されます。Vision AIは手書き、チェックボックス、スタンプなども認識して抽出できます。

はい。表の各行を独立したデータレコードとして取り出せます。すべてのエンジンで表の抽出が可能で、行数が変動するケースや複数ページにまたがる表にも対応します。スプレッドシートは自動的に表として認識されます。

精度は使うエンジンと書類の内容によります。テンプレートは完全に同一のレイアウトに対して常に同じ出力を返します。Vision AIは複雑な帳票や多様なレイアウトに強く、Text AIはテキスト中心の書類に最適です。すべての解析の前に事前処理で書類を整え、出力前に検証も行うため、安定した精度が得られます。

サンプル書類をアップロードするだけで、Parseurが抽出候補のフィールドを自動で提案します。各フィールドに英語で抽出指示を書けば、AIがレイアウトの違う新しい書類でも狙ったデータを取り出します。機械学習モデルの学習やコーディングは一切不要です。

いいえ、必須ではありません。Vision AIとText AIは英語で書いた抽出指示だけで動きます。常にまったく同じ出力が必要なケースや完全に定型化されたフォームには、テンプレート方式も選べます。

はい。スキャン、写真、画像PDFはOCRが自動で動き、テキストを取り出します。テキスト層のあるPDFなど、すでにテキスト情報がある書類ではOCR工程はスキップされます。

OCRは手書きを含めて200以上の言語に対応しています。AIエンジンは主要言語の書類はもちろん、各国独自の日付や数値フォーマットも自動で判別します。

はい。Vision AIとText AIなら、サプライヤーごとにレイアウトが違う書類でもテンプレートなしで柔軟に対応します。多様な帳票や領収書を1つのメールボックスでまとめて処理できます。

はい。アカウントを作成し、メールボックスを新規作成して、抽出したいPDFのサンプルをアップロードしてください。最初のアップロード時点でParseurが抽出候補を自動で提案します。フィールドや指示文はいつでも調整可能で、書類ごとに最適なエンジンが自動で選ばれます。Google Sheets、CRM、データベース、任意のエンドポイントへもノーコードで連携できます。