メールやPDFから抽出したデータをn8nに送信する


n8nは開発者や技術チーム向けの強力な自動化プラットフォームですが、文書パースで本格運用するにはギャップがあります。標準のRead PDFノードは、きれいなPDFから生テキストだけを抽出します。OCR、表の抽出、スキャン済みドキュメント対応はありません。より複雑な処理には、カスタムJavaScriptを書いたり、pdftotextをコマンド実行ノード経由で使ったり、外部APIを呼んだりと、多くの手間が必要です。
Parseurなら、この全てを解決します。AIを使ったフィールド抽出で、メール・PDF・スキャン文書から構造化データを取得し、クリーンなJSON形式でn8nワークフローへ直接送り込みます。どんな項目を抜き出すかはParseurで設定し、n8nはその後のルーティング処理に専念できます。
主なポイント
- n8n標準のPDFノードはテキストのみでOCR非対応。ParseurならAI抽出・スキャン文書対応・表抽出が追加され、n8n単体ではできない処理も実現可能。
- ParseurはDocument Processed、Flattened Tables、Table Item Processed、Export Failedなど、イベントごとに構造化JSONをn8nに送信します。
- Parseurコネクタはn8n Cloud向けに提供。セルフホストn8nはWebHookで即本番運用可。
- Parseur側の抽出設定にはコーディング不要。n8nはそのデータルーティングや追加ロジックに特化できます。
- Parseurもn8nも無料プランあり、全体フローを無料でテストできます。
n8nが文書対応で抱える課題

n8nのPDF処理は、メンテナンス負担のある回避策が必要です:
- Read PDFノードは生テキスト抽出のみで、表構造は失われる
- スキャンPDF・画像ベースの書類は外部OCRサービスが必要
- 請求書番号や合計金額など特定項目の抽出にはカスタムJavaScriptや正規表現が必要
- 明細行がテキストブロックとしてまとめて出力され、さらに追加パース処理が必要
Parseurはこれらすべてを「n8nへ渡す前」に処理します。請求日・取引先名・明細行・合計金額なども、一つずつ名前付きJSONとしてn8nに届くため、コマンドラインツールや手書き関数・正規表現のメンテは不要です。
Parseurとn8nで作れる自動化
Parseurとn8nを連携すれば、抽出層は全自動で処理され、n8n側はルーティングや後続処理に集中できます。
- 請求書→ERPやGoogle Sheets:取引先名・請求日・小計・税額・合計・明細行を自動抽出し、ERPへの新規レコード登録やGoogle Sheetsへのレポート行追加も自動化。請求書処理ガイドも参照ください。
- 注文メール→データベース:注文ID・顧客情報・商品情報を受信メールからパースし、PostgresやMySQLに格納。手入力ゼロで最新化。ECパース自動化ガイド
- 配送通知→Slack:配送通知の着信やドキュメントエクスポート失敗時に即時Slack通知。リアルタイムに状況共有できます。
- 添付ファイルをDriveへ、メタデータをCRMへ:PDFはGoogle Drive等に保存、抽出した請求書番号や顧客名・支払い金額はCRMに送信。リードメール処理ガイド
- 不動産リスト→データベース:物件リストメールから抽出した情報を追跡シートやCRMへ直送。不動産ユースケース
連携の流れ
セットアップは3ステップです。
- Parseurメールボックスに新しいメールやドキュメントが届く
- Parseurが設定した項目を抽出し、コネクタやWebHook経由でクリーンなJSONをn8nに送信
- n8nがワークフローを実行し、各種アプリやDBへデータをルーティング
Parseurの抽出定義は一度だけ設定すればOK。以降ルーティングはすべてn8n側へ。

ステップバイステップ: Parseurとn8nを接続する
ステップ1: ドキュメントをParseurに転送
各Parseurメールボックスには専用メールアドレスが付与されます。サンプルメールやPDFを転送すれば、数秒でParseur上に表示され(添付ファイルも含む)、即処理できます。
新着ドキュメントを自動転送したい場合は、GmailやOutlookの自動転送ルール設定手順も参照してください。
ステップ2: 抽出したい項目を定義
対応フォーマットについては、Parseur内蔵のテンプレートですぐに自動抽出が可能です。
カスタム形式書類の場合は、テンプレート作成方法をご覧ください。各項目をハイライトし、名前を付けるだけで抽出設定ができます。同じ形式書類なら今後は自動で同じパース結果に。明細行や表データも、追加設定なしで構造化オブジェクトとして抽出されます。
ステップ3: n8nにParseurノードを追加
n8nにログインし、新しいワークフロー作成→Parseurノードを検索&追加し、APIキーでParseurアカウントと接続します。その上で好みのトリガーイベントを選びます。
- Document Processed:標準JSONイベント
- Flattened Tables:複数行の表データ付きドキュメント向け
- Table Item Processed:テーブルの各行で個別発火
- Export Failed:エラー通知やSlackアラート
ステップ4: ドキュメントを処理し項目をマッピング
Parseurメールボックス画面でドキュメントを「再処理」すれば、抽出結果がn8nの実行ログに現れます。あとはGoogle Sheets、Slack、Postgres、CRM などアクションノードを追加し、Parseurフィールドを {{ $json.field_name }} 形式でマッピングします。
画面付きガイドはConnecting Parseur to n8n(公式サポート)を参照してください。
Parseurコネクタと汎用WebHookの違い
Parseurからn8nへは2通りの接続方法があり、環境によって最適手段が異なります。
| オプション | おすすめ用途 | メリット | 注意点 |
|---|---|---|---|
| Parseurコネクタ(推奨) | n8n Cloud利用者 | 設定が簡単・イベント認識・Parseur専用設計 | ベータ提供中、未対応インスタンスあり |
| Generic Webhook | セルフホストn8nや柔軟制御したい場合 | どこでも動作・ヘッダーやルーティングを完全制御 | n8n側でWebHook手動設定が必要 |
Webhookでの詳細な連携手順はWebhooksによるデータ送信方法ガイドをご覧ください。
n8n・Make・Zapierの使い分け
Parseurは3つの自動化基盤すべてで利用できます。n8nは自社ホストやカスタムJavaScript・API/DB接続重視の開発チーム向け、Makeはセルフホスト不要で複雑な多ステップ・ビジュアルフローに最適、Zapierは2アプリ間の最速ノーコード連携に向きます。詳しくはZapier vs Make vs n8n徹底比較もご参照下さい。
関連ドキュメントに使える無料ツール
フル連携構築が不要な場面でも、下記ツールでブラウザ上からアカウント不要で変換できます:
- PDF to JSON converter:PDFから構造化JSON出力、n8n連携に最適
- Invoice to JSON converter:請求書項目をJSONとして抽出
- PDF to Excel converter:PDF→スプレッドシート変換
- PDF to CSV converter:PDF表データをCSVでエクスポート
同じ文書タイプが定期的にメール着信する場合は、Parseur×n8nのフル自動化連携で到着ごとに処理できます。

Parseurとは?

Parseurは、メールやPDF、各種ドキュメントからテキストデータを抽出し、業務プロセスの自動化を実現する強力なドキュメント処理ソフトウェアです。 Parseurの全機能はこちら。

これはn8nとは?

N8Nは、重いコーディング不要でさまざまなアプリやサービスを接続できるワークフロー自動化プラットフォームです。ビジュアルエディタでワークフローを設計でき、データ移動やアクションのトリガー、複数ツール間のプロセス効率化が簡単に行えます。




