Parseurをご利用いただくのが初めての方のためにご案内します。Parseurは、添付ファイルの有無を問わず、様々なフォーマットのメールからデータ抽出ができるメールパーサー兼PDFパースツールです。Parseurはビジネスのデータ入力業務を自動化するロボティック・オートメーションツールとして活用されています。
Parseurには数多くの独自データ抽出機能が備わっており、手作業によるデータ入力を削減できます。その中でも特に魅力的なのが、無制限テンプレート機能です!
パーステンプレートとは?
他社のメールパーサーでは、抽出したい項目ごとに個別の抽出ルールを作成する必要がありますが、Parseurではテンプレートを使ってデータ抽出を行います。
パーステンプレートとは、抽出したい情報を視覚的にハイライトすることで、ドキュメントからどのデータを抜き出したいか指定できる仕組みです。テンプレートは抽出したいデータの「見た目」をそのまま使うため、長期的なメンテナンスも容易です。

Parseurの無制限テンプレート機能
最初のドキュメントをParseurのメールボックスに送信した後、テンプレートを作成します。このとき、メールからどんな情報を抽出したいのかを視覚的にParseurへ教えます。
テンプレートを保存すると、元のドキュメントはもちろん、同様のレイアウトを持つすべてのドキュメントからもデータが抽出されます。
ですが、もし同じようなデータを抽出したいもののレイアウトが異なる他のドキュメントがあったらどうするでしょう?たとえば、他社から届いた似た内容のメールなどです。新しいテンプレートを作成するだけでOKです!
レイアウトごとにメールボックスを分ける必要も、Parseurにどのテンプレートをどの文書へ使うか教えるためのルーティングルールを作る必要もありません。1つのメールボックスに複数のテンプレートがある場合でも、Parseurは新たなドキュメントが届くたびに自動でぴったりのテンプレートを適用します。 似たドキュメントはすぐに自動処理されます!
これがParseurの「秘密の材料」 ― ドキュメントレイアウトごとに必要な数だけ素早くテンプレートを作成できる強みです!
では、Parseurがどうやって適切なテンプレートを選んでいるのでしょうか?それは機械学習によるものなんです!
機械学習とは?
機械学習(Machine Learning, ML)は、コンピューターアルゴリズムを用いて、明示的なプログラミングなしにデータ処理やビジネスプロセスの自動化を実現する手法です。機械学習モデルは、例えばドキュメントパースやデータ抽出など、さまざまな分野で活用されています。
Parseurでの機械学習活用
Parseurは機械学習を使って、毎回自動で適切なテンプレートを選択します。新しいテンプレートを作成するたび、Parseurはどんなふうにデータを抽出すべきかを学習し、テンプレートが増えるほど賢くなっていきます。
PDFやMS Wordなどのメール添付データも、情報をハイライトしてフィールドを作成するだけでOKです。次回以降同種ドキュメントを転送するだけで、処理が自動で完了します。
これは学習モデル型ツールのように、使うほどデータ抽出がどんどん効率的・自動的に進化していきます。Parseurを使えば正確なパース済みメールデータが手に入ります!Parseurがどのように最適なパーステンプレートを選ぶか詳しくはこちら。
さらに進化:テンプレートゼロでのパース
Parseurの無制限テンプレート機能と機械学習の組み合わせにより、テンプレートを作らずにパースできる世界も広がりました!
実際、Parseurには業種ごとに使える組み込みテンプレートライブラリーが最初から搭載されており、不動産、フードオーダー、求人情報、Googleアラートなど、多様な業界のドキュメントを自動抽出できます。
Parseurはメールボックスで受信した各メールに合致するテンプレートを自動で選び、それぞれに応じてデータ処理します。
このテンプレートゼロ機能を活用したい場合は、メールボックス作成時にパースしたいドキュメントのタイプを選択してください。

後はParseurのメールボックスへドキュメントを転送するだけ。Parseurがそのドキュメントに対応済みなら、自動的にデータが抽出されます!
また、ユースケース紹介セクションもぜひご覧いただき、Parseurがさまざまな業界でどのような成果を出しているかご確認ください!
最終更新日