自动从 OneDrive 中存储的 PDF 提取数据


许多团队都将 PDF 文件存储在 OneDrive 中:供应商发票被上传到共享文件夹,扫描表单经办公室扫描仪上传,员工接收到的合同直接保存。文件虽然集中在一起,但实际要获取数据时,仍需人工下载、打开解析工具,再手动提取。
此集成彻底消除了这个繁琐步骤。Zapier 可以实时监控 OneDrive 文件夹的新文件,并自动将每个文件发送到 Parseur。Parseur 会提取你自定义的结构化字段,数据无需手动操作即可导出或自动流转至其它任意应用。
鉴于 OneDrive 是 Microsoft 365 生态的一部分,Power Automate 也是本流程的天然搭档,与 Zapier 一样可与 Parseur 集成并监控新文件。下方实例以 Zapier 为例进行讲解,Power Automate 的配置方式亦类似。
关键要点
- Zapier 监控 OneDrive 文件夹,将每一个新文件自动发送至 Parseur。Power Automate 实现方式类似,适合已采用 Microsoft 365 的团队。
- Parseur 支持原生 PDF、扫描件(OCR)、图片、Word 文件等多种格式,只要 Parseur 支持的文件类型都可通过此集成自动处理。
- 提取后的数据可通过 Zapier、Make 或 Power Automate 路由导出到 Excel Online、SharePoint、CRM、Google 表格等任意应用。
- 此集成模式同样适用于 Google Drive、Dropbox 及其它支持 Zapier “新文件” 触发的云存储平台。
- Parseur 和 Zapier 都提供免费计划。
本集成可实现的自动化场景
当 OneDrive-Parseur 连通后,任何新文件进入指定文件夹即可自动触发完整的数据提取流程:
- 发票自动处理:财务团队共享 OneDrive 文件夹接收供应商发票。PDF 一经投递即发送至 Parseur,自动提取供应商名称、发票号、到期日和明细等字段,并流转到财务软件或管理表格。见 发票自动处理指南。
- 合同管理:法务或运营团队将合同材料保存到 OneDrive,Parseur 自动提取相关方名称、签订日期及关键要素。可将数据写入跟踪表格或自动激活 Teams、邮件等审核流程。
- 提单文件 处理:物流团队将运输文件上传至 OneDrive,Parseur 自动识别并提取货运明细、收货人、货物描述等信息。
- 扫描件自动处理:印刷或手写的纸质单据扫描后上传至 OneDrive,Parseur 内置 OCR 对表单、发票、手写收据等直接处理,无需额外配置。
- 共享团队文件夹:任何团队成员将文件投递至指定文件夹后即可实现自动处理,无需专人协调。
集成工作流程说明
- 新文件上传至你指定的 OneDrive 文件夹
- Zapier 检测到新文件并将它发送至你的 Parseur 邮箱
- Parseur 应用提取模板自动解析文档并将结构化数据提供导出或流转
你只需在 Zapier 指定文件夹,并在 Parseur 配置好模板。之后该文件夹新增的所有文件将被自动高效处理。
步骤详解:通过 Zapier 将 OneDrive 连接到 Parseur
第 1 步:创建你的 Parseur 邮箱
创建你的 Parseur 邮箱,并选择与你文档类型相匹配的邮箱类型。Parseur 针对 发票、提单 等多种场景有预设模板。若为自定义文档类型,可选择 AI 辅助的默认邮箱。
第 2 步:将 OneDrive 作为 Zapier 触发器
登录你的 Zapier 账号,搜索 OneDrive 和 Parseur 集成。


设定 OneDrive 为触发应用,触发事件为 New File。连接你的 OneDrive 账户并授权 Zapier 访问。

选择你需要监控的文件夹。

Zapier 会拉取一个样本文件,以验证连接正常。

第 3 步:将 Parseur 设为操作步骤
选择 Parseur 作为操作应用,操作事件为 Create Document from File。连接你的 Parseur 账号并选择目标邮箱。

第 4 步:测试 Zap 配置
发送一次测试,确保文件可顺利从 OneDrive 传送至 Parseur。

第 5 步:开启 Zap 工作流
测试通过后,激活 Zap。从此每有新文件上传至该文件夹都会自动推送到 Parseur。

Parseur 会按你的自定义提取模板自动解析文档,数据结构化后即可导出或路由至下游系统。
如用 Power Automate 替代 Zapier
若你的团队已全面采用 Microsoft 365 推荐使用 Power Automate 实现此自动化。Power Automate 拥有原生 OneDrive 与 SharePoint 连接器,可直连 Teams、Dynamics 365 及更多微软服务。Parseur 作为 Power Automate 的连接器集成,提取步骤保持一致。当目标系统为微软生态,Power Automate 更适合;要集成 Google Sheet 或非微软 CRM,用 Zapier 配置更快捷。
相关文档类型的免费工具
如需在自动化集成前先查看 PDF 数据结构,可在浏览器中使用以下免费转换工具:
- PDF 转 Excel:将 PDF 数据提取到电子表格中
- PDF 转 CSV:以 CSV 格式导出 PDF 表格数据
- PDF 转 JSON:以结构化 JSON 查看 PDF 中的提取数据

Parseur是什么?

Parseur是一款强大的文档处理工具,能够从电子邮件、PDF及其他文档中提取数据,并实现工作流程自动化。 查看Parseur全部功能。

什么是OneDrive?

微软 OneDrive 于 2007 年推出,使用户能够存储、分享和同步文件。

Zapier是什么?

Zapier是一款云端自动化工具,可以将多个应用程序互联。您可以连接两个或更多应用,实现无需代码和开发资源的重复任务自动化。

Power Automate是什么?

Microsoft Power Automate(前身为Microsoft Flow)是一款能够将基于云的应用和服务无缝连接的自动化工具。借助Flow,您可以更便捷地与包括Outlook、Excel、SharePoint、Dynamics CRM、SQL Server等在内的Microsoft应用协作。





