データ抽出プラットフォームの全機能
ドキュメントを、そのまま使えるデータに。
取り込みから連携まで、すべてひとつのプラットフォームで完結。整ったデータが、社内システムへ自動で届き、処理状況もすぐに確認できます。
01
コア抽出エンジン
取り込み、抽出、正規化、連携まで。ドキュメント業務の4ステップを、ひとつのプラットフォームに集約しました。
ドキュメントを自動で取り込み
無制限のメールボックスに、社内のあらゆるチャネルからドキュメントが集まります。メール、PDF、スキャン、25種以上のファイル形式に対応。
- ワークフローごとに専用メールアドレスを発行し、転送するだけ
- REST APIやウェブ画面へのドラッグ&ドロップでも追加可能
- Zapier、Make、Power Automate経由でDrive、Dropbox、SharePointから自動取得
3つの抽出エンジンを使い分け
レイアウトが複雑な書類はVision AI、本文中心の書類はText AI、フォーマットが固定の書類はテンプレート方式。ひとつのメールボックスで、あらゆる書式をカバーします。
- 書類ごとに最適なエンジンを自動で選択
- 明細行や取引行など、表形式のデータもまるごと抽出
- OCRは200以上の言語に対応。1億件超の処理実績で前処理を磨き込み
データの正規化と検証
メールボックスごとに定義したスキーマに合わせて、すべてのフィールドを自動でフォーマット・検証。下流のシステムがそのまま取り込める形で出力します。
- 異なる文書タイプでもフィールドの形式を統一
- 日付、数値、住所、選択肢などを自動で整形・検証
- 必要に応じてPythonでのカスタム後処理も追加可能
リアルタイムで出力・連携
処理が完了した瞬間に、CRM、会計システム、データベースへデータが届きます。ネイティブ連携、業務自動化ツール、独自エンドポイント向けのWebhookまで完備。
- Zapier、Make、Power Automate、n8n経由で10,000以上のアプリと接続
- 再送、認証、配信ログを備えたリアルタイムWebhook
- Googleスプレッドシートとライブ同期。Excel・CSV・JSONのダウンロードにも対応
02
信頼性とコントロール
エンジンを支える土台。手のかからない運用、徹底した可視化、堅牢なインフラ、そして最初から組み込まれたセキュリティ。
現場だけで運用できる
数分で稼働開始。レイアウトが変わっても、業務担当者の手だけで対応できます。
- モデルの学習作業は不要。抽出ルールは自然な文章で書くだけ
- 設定、フィールド、指示文はすべて画面上で即時に変更可能
- エンジニアに依頼せず、運用担当者だけで更新が完結
全工程の見える化
受信から出力までの状況をリアルタイムで把握。見落としやエラーをすぐに発見できます。
- 処理ステップごとに詳細ログを保持
- 処理失敗、出力エラー、上限到達などをアラートで通知
- 役割ベースの権限管理と監査ログを標準装備
堅牢なインフラ
2016年から稼働を続け、累計1億件以上のドキュメントを処理。急なトラフィック増加や連携先の不調にも揺らがない設計です。
- 稼働率99.9%以上。通常は99.98%超で推移
- アカウントごとに処理キューを分離し、他社の負荷の影響を遮断
- すべてのAPI呼び出しと外部Webhookに自動リトライ
セキュリティとコンプライアンス
プライバシー、法令遵守、厳密なデータ管理を前提に設計しています。
- EU内でホスティング、GDPRに準拠した設計
- SOC 2 Type IIとHIPAAの認証取得を進行中
- 保持期間を設定して、古いドキュメントを自動で削除