メールやPDFから抽出したデータをn8nに送信する

Parseur logo n8n logo

n8nは開発者や技術チーム向けの強力な自動化プラットフォームですが、文書パースで本格運用するにはギャップがあります。標準のRead PDFノードは、きれいなPDFから生テキストだけを抽出します。OCR、表の抽出、スキャン済みドキュメント対応はありません。より複雑な処理には、カスタムJavaScriptを書いたり、pdftotextをコマンド実行ノード経由で使ったり、外部APIを呼んだりと、多くの手間が必要です。

Parseurなら、この全てを解決します。AIを使ったフィールド抽出で、メール・PDF・スキャン文書から構造化データを取得し、クリーンなJSON形式でn8nワークフローへ直接送り込みます。どんな項目を抜き出すかはParseurで設定し、n8nはその後のルーティング処理に専念できます。

主なポイント

  • n8n標準のPDFノードはテキストのみでOCR非対応。ParseurならAI抽出・スキャン文書対応・表抽出が追加され、n8n単体ではできない処理も実現可能。
  • ParseurはDocument Processed、Flattened Tables、Table Item Processed、Export Failedなど、イベントごとに構造化JSONをn8nに送信します。
  • Parseurコネクタはn8n Cloud向けに提供。セルフホストn8nはWebHookで即本番運用可。
  • Parseur側の抽出設定にはコーディング不要。n8nはそのデータルーティングや追加ロジックに特化できます。
  • Parseurもn8nも無料プランあり、全体フローを無料でテストできます。

n8nが文書対応で抱える課題

Parseur and n8n integration
Parseur and n8n integration

n8nのPDF処理は、メンテナンス負担のある回避策が必要です:

  • Read PDFノードは生テキスト抽出のみで、表構造は失われる
  • スキャンPDF・画像ベースの書類は外部OCRサービスが必要
  • 請求書番号や合計金額など特定項目の抽出にはカスタムJavaScriptや正規表現が必要
  • 明細行がテキストブロックとしてまとめて出力され、さらに追加パース処理が必要

Parseurはこれらすべてを「n8nへ渡す前」に処理します。請求日・取引先名・明細行・合計金額なども、一つずつ名前付きJSONとしてn8nに届くため、コマンドラインツールや手書き関数・正規表現のメンテは不要です。

Parseurとn8nで作れる自動化

Parseurとn8nを連携すれば、抽出層は全自動で処理され、n8n側はルーティングや後続処理に集中できます。

  • 請求書→ERPやGoogle Sheets:取引先名・請求日・小計・税額・合計・明細行を自動抽出し、ERPへの新規レコード登録やGoogle Sheetsへのレポート行追加も自動化。請求書処理ガイドも参照ください。
  • 注文メール→データベース:注文ID・顧客情報・商品情報を受信メールからパースし、PostgresやMySQLに格納。手入力ゼロで最新化。ECパース自動化ガイド
  • 配送通知→Slack:配送通知の着信やドキュメントエクスポート失敗時に即時Slack通知。リアルタイムに状況共有できます。
  • 添付ファイルをDriveへ、メタデータをCRMへ:PDFはGoogle Drive等に保存、抽出した請求書番号や顧客名・支払い金額はCRMに送信。リードメール処理ガイド
  • 不動産リスト→データベース:物件リストメールから抽出した情報を追跡シートやCRMへ直送。不動産ユースケース

連携の流れ

セットアップは3ステップです。

  1. Parseurメールボックスに新しいメールやドキュメントが届く
  2. Parseurが設定した項目を抽出し、コネクタやWebHook経由でクリーンなJSONをn8nに送信
  3. n8nがワークフローを実行し、各種アプリやDBへデータをルーティング

Parseurの抽出定義は一度だけ設定すればOK。以降ルーティングはすべてn8n側へ。

n8n workflow with Parseur as the trigger
Parseur sends structured JSON to n8n, which routes it to your apps

ステップバイステップ: Parseurとn8nを接続する

ステップ1: ドキュメントをParseurに転送

各Parseurメールボックスには専用メールアドレスが付与されます。サンプルメールやPDFを転送すれば、数秒でParseur上に表示され(添付ファイルも含む)、即処理できます。

新着ドキュメントを自動転送したい場合は、GmailやOutlookの自動転送ルール設定手順も参照してください。

ステップ2: 抽出したい項目を定義

対応フォーマットについては、Parseur内蔵のテンプレートですぐに自動抽出が可能です。

カスタム形式書類の場合は、テンプレート作成方法をご覧ください。各項目をハイライトし、名前を付けるだけで抽出設定ができます。同じ形式書類なら今後は自動で同じパース結果に。明細行や表データも、追加設定なしで構造化オブジェクトとして抽出されます。

ステップ3: n8nにParseurノードを追加

n8nにログインし、新しいワークフロー作成→Parseurノードを検索&追加し、APIキーでParseurアカウントと接続します。その上で好みのトリガーイベントを選びます。

  • Document Processed:標準JSONイベント
  • Flattened Tables:複数行の表データ付きドキュメント向け
  • Table Item Processed:テーブルの各行で個別発火
  • Export Failed:エラー通知やSlackアラート

ステップ4: ドキュメントを処理し項目をマッピング

Parseurメールボックス画面でドキュメントを「再処理」すれば、抽出結果がn8nの実行ログに現れます。あとはGoogle Sheets、Slack、Postgres、CRM などアクションノードを追加し、Parseurフィールドを {{ $json.field_name }} 形式でマッピングします。

画面付きガイドはConnecting Parseur to n8n(公式サポート)を参照してください。

Parseurコネクタと汎用WebHookの違い

Parseurからn8nへは2通りの接続方法があり、環境によって最適手段が異なります。

オプション おすすめ用途 メリット 注意点
Parseurコネクタ(推奨) n8n Cloud利用者 設定が簡単・イベント認識・Parseur専用設計 ベータ提供中、未対応インスタンスあり
Generic Webhook セルフホストn8nや柔軟制御したい場合 どこでも動作・ヘッダーやルーティングを完全制御 n8n側でWebHook手動設定が必要

Webhookでの詳細な連携手順はWebhooksによるデータ送信方法ガイドをご覧ください。

n8n・Make・Zapierの使い分け

Parseurは3つの自動化基盤すべてで利用できます。n8nは自社ホストやカスタムJavaScript・API/DB接続重視の開発チーム向け、Makeはセルフホスト不要で複雑な多ステップ・ビジュアルフローに最適、Zapierは2アプリ間の最速ノーコード連携に向きます。詳しくはZapier vs Make vs n8n徹底比較もご参照下さい。

関連ドキュメントに使える無料ツール

フル連携構築が不要な場面でも、下記ツールでブラウザ上からアカウント不要で変換できます:

同じ文書タイプが定期的にメール着信する場合は、Parseur×n8nのフル自動化連携で到着ごとに処理できます。


Parseur logo
Parseurとは?

Parseurは、メールやPDF、各種ドキュメントからテキストデータを抽出し、業務プロセスの自動化を実現する強力なドキュメント処理ソフトウェアです。 Parseurの全機能はこちら。

n8n logo
これはn8nとは?

N8Nは、重いコーディング不要でさまざまなアプリやサービスを接続できるワークフロー自動化プラットフォームです。ビジュアルエディタでワークフローを設計でき、データ移動やアクションのトリガー、複数ツール間のプロセス効率化が簡単に行えます。

さらに詳しく

こちらもおすすめ

今すぐ始める

書類のデータ入力、
まだ手作業で続けますか?

数分で設定完了。業務で使う書類からデータを自動で抽出できます。

AIモデルの学習や複雑な初期設定は一切不要
導入したその日から本番業務で使える
少量の処理から大量の自動化まで柔軟に対応

よくある質問

Parseurとn8nを連携してメール・ドキュメントを自動抽出する際によくある質問に回答します。

n8nには、ネイティブ(スキャンされていない)PDFからプレーンテキストを抽出する簡易的なRead PDFノードがありますが、OCR、表の抽出、スキャン済みドキュメントの処理はできません。シンプルなテキスト抽出を超える用途には外部ツールが必要です。Parseurはそのギャップを埋め、PDF、スキャン文書、画像、構造化された表データなども抽出し、クリーンなJSONを自動でn8nに送信します。

はい。セルフホストn8nユーザーは一般的なWebHookノードでParseurと接続できます。ParseurがWebHookのエンドポイントに到達できるよう、n8nを外部公開してください。Parseurコネクタはn8n Cloud向けに動作します。

n8nでParseurコネクタまたはWebHookを用意し、Parseurをトリガーに設定します。次にGoogle Sheetsノードを追加し、ParseurのJSONフィールドをn8nのマッピングインターフェースでスプレッドシート列に割り当てます。Parseurが新規ドキュメントを処理するたび、自動的にシートへ行が追加されます。

必要ありません。Parseurは抽出項目を指定するノーコードツールです。n8nのParseurコネクタもAPIキーだけでコードレス接続できます。n8nワークフローで追加ロジックや変換を行いたい場合はJavaScriptが使えますが、基本設定は不要です。

はい。ParseurはHTTPSを使ってn8nのエンドポイントへデータ送信します。WebHook方式の場合もカスタムヘッダーやシークレットを加えることで検証強化が可能です。セルフホストなら機密ワークフローを自社内に閉じて運用可能です。

はい。n8nの公式Parseurコネクタが利用可能です。コミュニティ作成ノードも存在します。インスタンスでコネクタが見つからない場合でも、WebHook方式ですぐに本番運用可能です(n8n Cloud・セルフホストどちらでも可)。

Parseurはn8n向けに4つのトリガーイベントをサポートします。Document Processed(標準JSONペイロード)、Flattened Tables(テーブル付きドキュメント向け)、Table Item Processed(テーブル各行で個別発火)、Export Failed(エラー通知やSlack連携に最適)です。

はい。Parseurは明細行を構造化テーブルデータとして抽出し、それぞれ行ごとに個別のJSONオブジェクトとしてn8nに送信します。n8nのPostgres、MySQL、その他のDBノードを使って、各行ごとにレコード作成が可能です。請求書や発注書など、行データのある書類すべてで使えます。

ParseurコネクタはParseur向けに設計され、イベントごとにトリガーが分かりやすく選択できる公式ノードです。汎用WebHookはすべてのn8n環境で使え、ヘッダーやルーティングなどの制御も柔軟です。コネクタ未対応のセルフホスト環境やより細かな制御が必要な場合にWebHookが便利です。

自動化基盤を自社ホストしたい、ワークフローにカスタムJavaScriptが必要、またはAPI・DBとの柔軟な接続が必要な場合n8nが最適です。簡易な2サービス間連携はZapierがスピーディー、複数ステップの高度なビジュアルフローにはMakeが向きます。