遅ればせながら、明けましておめでとうございます!
前回のアップデートから時間が空きましたが、ご安心ください。私たちは引き続き活発に取り組んでいます。大規模なPDFパース機能のアップグレードのリリース以降、より多くのユースケースに対応できるよう、エンジンの改良と最適化を継続してきました。
2023年のスタートは、パースワークフローをさらに快適にするためのいくつかの小規模な改善から始まっています。
新機能:最新ドキュメントデータのみのエクスポート
複数のお客様から、パースした直近のドキュメントデータのみを手軽にダウンロードしたい、というご要望をいただいていました。よくあるのは、日々更新されるレポートを受信し、最新のものだけを利用したいパターンです。新しいレポートが届くと、以前のデータは不要となり、最新ドキュメントのデータだけが必要になります。
そこで「最新ドキュメントのみ」エクスポートオプションを、ダウンロードおよびGoogle Sheetsへのエクスポート機能に追加しました。

新機能:ドキュメント下部からラベルを検索
ラベルは、ドキュメント上で水平方向や垂直方向に可変するデータフィールド抽出を可能にする、当社のDynamic OCR機能の基盤となっています。
OCRテンプレートでラベルを作成すると、Parseurはそのラベルが何回出現し、そのトータル数がいくつかを自動認識します。複数回出現するものについては、この情報を活用して適切な位置を特定します。
ラベルの出現回数は、通常ドキュメントの上から数えますが、場合によってはドキュメントの下側からラベルを特定したいこともあります。例えば「Total」の出現回数がドキュメントごとに異なるものの、常に最後に出てくる「Total」だけを抽出したいケースなどです。
今回のアップデートで、ラベルオプション画面からラベルの出現回数をドキュメント下部から数えるように設定できるようになりました。

その他の改善とバグ修正
- 特殊なPDFや独自構造のPDFもより正確に処理できるよう、内部的に多くのアップデートを行いました。(PDFには本当に千差万別なバリエーションがあります)
- メールボックスのフィールド使用状況ページでOCRテンプレートで使われているフィールドも見えるようになりました。
今月のアップデートは以上です!今後も、チャットまたはフィードバックページから皆さまのユースケースやご要望をぜひお聞かせください。
最終更新日