テンプレートベースのデータ抽出エンジン
当社のテンプレートエンジンは、Parseur に搭載されている 2 種類のデータ抽出エンジンのうちの 1 つで、もう 1 つは AI エンジンです。 テンプレートエンジンを使用すれば、Parseur に抽出するデータを示すのは、サンプルドキュメントから欲しいテキストのブロックをハイライトするだけで簡単に行えます。 その後、Parseur は類似するすべてのドキュメントからデータを抽出します。
ちょっと待って。テンプレートってどんなもの?
テンプレートベースのデータ抽出におけるテンプレートとは、抽出したいデータを視覚的にハイライトすることで、必要な情報を簡単に指定できるドキュメントのひな型です。従来のパーシングルールと比べて、設定やメンテナンスが直感的で効率的です。
異なるレイアウトのドキュメントにも柔軟対応
現場では、レイアウトが異なる多様なドキュメントからデータを取得する必要がよくあります。テンプレートエンジンは、マルチテンプレート対応および自動レイアウト検出によってこれらの課題をスムーズにクリアします。
-
マルチテンプレートが標準機能
- 必要に応じて、メールボックスごとに任意の数のテンプレートを作成できます(レイアウトごとに1つずつ)。異なるレイアウトごとにメールボックスを分けたり複雑なルールを作成する必要はありません。
-
自動レイアウト検出
- 1つのメールボックスに複数テンプレートが登録されている場合は、Parseur が新規ドキュメントごとに、最適なテンプレートを自動で選択します。レイアウト指定などの手間は一切不要です。
テンプレート作成不要、すぐ使えるテンプレートも搭載
Parseur には各業界向けの事前構築テンプレートが豊富に用意されています。これは ゼロテンプレートパースと呼ばれ、ドキュメントをアップロードするだけで、該当テンプレートが自動適用されます。
対応業界例:
-
不動産
- 世界中の主要な不動産プロバイダー (Zillow、StreetEasy、Apartments.com など) のリード連絡先情報を自動で抽出します。
-
フード注文
- 主要フード注文プラットフォーム (Doordash、Grubhub、Toast、Slice など) のメールや PDF の注文データ抽出を自動化。
-
Google アラート
- Google アラートの情報を Google スプレッドシートや他アプリへと自動でエクスポートし、モニタリングを効率化します。
-
求人応募
- LinkedIn や Indeed の応募メールから自動で応募者情報を抽出可能です。
-
ホテル・短期宿泊予約
- Airbnb、VRBO などの予約確認書からも自動データ抽出が可能です。
究極のデータ抽出を可能にする Zonal & Dynamic OCR
Parseur の高機能 OCR は、ゾーナルおよびダイナミック OCR 技術によってドキュメントからのデータ自動抽出を最適化します。