自动从Google Drive中的PDF提取数据

Parseur logo Google Drive (incoming) logo

如果你的团队将PDF文件存储在Google Drive,你手中已经有一个堆满文档的文件夹需要处理。手动方法是把每一个文件下载,然后再逐个上传到解析工具。这种方法对少数文档还可以,但如果每天都有发票、合同或申请表进来,效率就会极低。

自动化方案则是: 通过Zapier监控一个Google Drive文件夹的新增文件。每次文件夹里出现PDF时,Zapier会自动把它发送到Parseur。Parseur会自动提取你定义好的结构化字段,完全无需人工操作,数据即可导出或自动传送到其他应用。

同样的集成方法也适用于 OneDrive、Dropbox、Box 以及任何支持Zapier“New File in Folder”触发的云存储平台。只需将Drive触发器换成相应平台,Parseur设置不变。

重点摘要

  • Zapier自动监控Google Drive文件夹,有新文件时自动发送至Parseur抓取数据,无需手动下载上传。
  • Parseur支持原生PDF、扫描件(通过OCR)、图片、Word文档等多种类型。只要Parseur支持的类型,都能通过此流程推送。
  • 触发器为Google Drive Zapier应用中“New File in Folder”,所有出现在监控文件夹的新文件都会触发,包括同事上传的。
  • 提取完成后,解析数据可自动传递到Google Sheets、QuickBooks、CRM等任意应用,支持Zapier或Make全流程。
  • 完全同样的模式适用于OneDrive、Dropbox、Box等。

你可以用此集成实现什么场景

Drive到Parseur的自动化Zap运行后,任何出现在目标文件夹的新文件都会自动触发全流程解析和路由:

  • 发票自动处理:财务团队共用一个Drive发票文件夹,收到供应商发票后自动发到Parseur,Parseur提取供应商名称、发票号、到期日和明细,然后自动同步到会计系统或追踪表。详见发票处理场景
  • 合同信息抽取:法务或运营团队保存新合同到Drive文件夹,Parseur自动提取关键字段(如合同方、日期、金额),自动记录到表格或触发审阅。
  • 简历与申请表处理:HR用Drive文件夹集中收集简历和表单,Parseur自动提取姓名、联系方式、技能等,推送到招聘追踪库。
  • 扫描文件批量流转:扫描仪直接上传到Drive的纸质文档,Parseur内置OCR无需配置即可抓取内容,支持表单、收据、手写发票等。
  • 共享团队文件夹:任何团队成员把文件放进被监控文件夹都能自动处理,无需彼此提醒。

集成流程是怎样的?

自动化流程包含三步:

  1. 你或同事、第三方工具将新文件上传(或移动)到被监控的Google Drive文件夹
  2. Zapier检测到新文件,自动推送到Parseur邮箱
  3. Parseur自动提取结构化字段,数据实时可导出或流转到下游应用

你只需在Zapier选择所需文件夹,在Parseur配置好提取模板,后续每个新文件都自动处理。

操作指南:通过Zapier连接Google Drive和Parseur

第1步:设置Google Drive为Zapier触发器

登录Zapier控制台,新建Zap,搜索Parseur与Google Drive的集成。

Google Drive和Parseur在Zapier中的集成
在Zapier中查找Google Drive和Parseur集成

设置Google Drive作为触发应用,选择New File in Folder为触发事件。关联你的Google Drive账号,选择要监控的文件夹。

添加Google Drive为触发器
添加Google Drive为触发器,事件为New File in Folder

Zapier将从文件夹中拉取一个文件样例,确认连接无误。

Zapier从Google Drive文件夹拉取样本文档
Zapier从你的Drive文件夹获取样文件

第2步:设置Parseur为动作应用

选择Parseur为动作应用,Create Document from File为触发动作。连接你的Parseur账号,并选择要发送文件的邮箱。

选择文件和Parseur邮箱
映射Drive文件至Parseur邮箱

第3步:测试Zap触发

发送测试,确认Drive文件能顺利流转到Parseur。

从Zapier向Parseur发送测试Zap
开启Zap前先测一次流转

第4步:开启Zap

测试通过后,激活Zap。后续,每个新上传到该文件夹的文件都会被自动推送到Parseur。

文档被自动发送、解析到Parseur
Parseur自动提取文件数据

Parseur会按你的模板提取字段。处理发票时,包括供应商、发票号、开票日期、明细、税额、总额等。

第5步:流转解析数据(可选)

Parseur每处理一个文件后,解析的数据都可以自动流转给其它应用,比如导出到QuickBooks或其它会计软件、写入Google Sheet表格或同步到CRM。

Parseur可与ZapierMakePower Automate等原生集成,也可以在同一个Zap里追加动作步骤,把数据直接流转到目标应用。

Parseur如何将文件保存回Google Drive

本文主要介绍“上传到Drive、自动提取数据”场景。如果你想让Parseur在处理完后将原始文档保存回Google Drive,请参见Google Drive导出集成教程

相关文档格式的免费工具推荐

如果你希望上线自动处理前,先预览PDF转为结构化数据的效果,可以试用这些无需注册、在线即可用的免费工具:

Parseur logo
Parseur是什么?

Parseur是一款强大的文档处理工具,能够从电子邮件、PDF及其他文档中提取数据,并实现工作流程自动化。 查看Parseur全部功能。

Google Drive (incoming) logo
什么是Google Drive?

Google Drive是一项文件存储服务,让您能够保存和备份数据,并可随时访问。前15GB空间免费。

Zapier logo
Zapier是什么?

Zapier是一款云端自动化工具,可以将多个应用程序互联。您可以连接两个或更多应用,实现无需代码和开发资源的重复任务自动化。

深入了解

你可能还喜欢

立即开始

告别手动录入,
就从今天起。

几分钟免费上手,亲自体验Parseur如何融入您的工作流。

无需训练模型
为真实业务场景打造
操作足够简单,API足够强大

常见问题解答

关于使用Parseur和Zapier自动从上传到Google Drive的PDF或其他文件中提取数据的常见问题。

在Zapier中设置一个Zap,将Google Drive设置为触发器(New File in Folder),Parseur设置为动作(Create Document from File)。每当有新的PDF出现在指定Drive文件夹时,Zapier会自动将其发送到你的Parseur邮箱。Parseur会提取你定义的字段,解析后的数据可自由导出或流转到其它应用。

支持。你可监控任何当前Google Drive账号有权限访问的文件夹,包括“共享云端硬盘”或他人共享给你的文件夹。适用于团队协作,每次有成员将文件放进共享文件夹都能自动处理。

可以。同样的自动化流程适用于OneDrive、Dropbox、Box等支持Zapier的云存储平台,只需将Google Drive触发器替换为相应平台的“New File in Folder”触发即可,Parseur的动作设置不变。

可以。你可以为每个文件夹创建单独的Zap,并将它们分别映射到不同的Parseur邮箱。例如,一个Zap监听发票文件夹并推送到发票邮箱,另一个Zap监听合同文件夹并推送到使用不同提取模板的合同邮箱。

可以。Make中有Google Drive模块可监控文件夹新增文件。你可以用其作触发器,然后添加Parseur的Webhook或HTTP模块将文件推送至Parseur邮箱。如果需要根据文件名、大小等条件将不同文件类型发送到不同Parseur邮箱,Make也很合适。

在Zapier中,选择“New File in Folder”作为Google Drive的触发事件。只要有新文件被添加到你指定的文件夹(包括团队成员上传、其它应用创建或移动至该文件夹的文件),此触发器都会响应。对于只修改或重命名的文件不会触发。

Parseur支持原生PDF、通过OCR识别的扫描PDF、图片(PNG、JPG、TIFF)、Word文档和CSV等多种格式。只要Parseur支持的文件类型,都可通过Zapier从Google Drive发送。对于扫描文件,Parseur自带OCR,自动识别内容,无需额外配置。

Parseur提取后,你可将数据导出为Excel、CSV或JSON,或通过Zapier/Make推送到其它应用。常见用法包括写入Google Sheets表格、在CRM或QuickBooks等会计系统创建记录、发送Slack通知,或触发你团队在Zapier上的任何自动化流程。

不会。Zapier的Google Drive触发器只会对Zap开启后新上传(或移动至该文件夹)的文件触发。如果要处理文件夹中已有的文件,你需手动将其发往Parseur或重新上传以激活Zap。

有。Parseur提供免费套餐,包含全部功能,只要每月文档不超过配额即可。Zapier也有支持多步自动化的免费套餐。你可在二者免费方案下完整测试Google Drive至Parseur自动化流程。