什么是动态OCR?

什么是动态OCR?

动态OCR 是 Parseur 开发的新一代先进OCR引擎。虽然AI OCR和区域OCR在数据提取方面表现出色,但各有局限。为解决这些问题,Parseur 推出了动态OCR,让您的数据提取流程更加流畅轻松。

Invoices where the total field moves vertically

区域OCR的局限性

区域OCR是从文档指定“区域”提取数据的工具。当数据字段处于固定位置时,该OCR工具效果最佳。区域OCR的缺点包括:

  • 无法提取在不同文档中动态变化位置的数据
  • 无法处理字段尺寸变化的情况
  • 难以准确识别扫描质量较差的文档

了解更多:区域OCR是什么

文档中有动态变化的字段怎么办?

像“表格行”“表格项”“合计”或“小计”等字段,取决于表格里项目的数量。在您的发票或采购订单(PO)中,这些字段通常不会永远处于相同的位置。

当字段水平或垂直移动,或者大小变化时,区域OCR难以准确获取数据。这是因为区域OCR只能在“区域”位置固定时发挥优势。

字段位置经常变化时,如何保证数据提取的准确性?

以财务数据为例,每月的财务报表都因成本、收入和利润等变动而不同。如果您需要快速进行财务审计并获取所需数据,区域OCR可能不是最佳方案。

但AI OCR不比动态OCR更好吗?

阅读我们的AI OCR完整指南,进一步了解对比情况。

全球OCR市场预计将在 2023年至2030年间以14.8%的复合年增长率快速增长。

AI OCR是第一代OCR技术,结合同机器学习和计算机视觉算法。AI引擎会利用神经网络定位数据提取字段。

AI OCR的局限性

AI OCR确实改变了数据提取和分析流程,但也有自身不足。

需要人工审核

将AI OCR软件集成到工作流时,通常建议增加人工数据审核环节。因为AI工具具有概率性,所以流程较慢,总要有人介入推动。

需要训练

您需要先训练AI模型,才能正式使用。整个训练过程耗时,尤其当待处理数据量大时,有些AI OCR需要多达4小时训练。

黑盒

如果AI模型出现故障,您只能重新训练,无法自定义回溯工具。

AI OCR价格昂贵

基于AI的OCR软件通常价格较高,更适合大型企业。如果您是中小企业或个人,可能不是最佳选择。

区域OCR vs AI OCR vs 动态OCR

我们总结了不同类型OCR引擎的主要区别:

AI OCR 区域OCR 动态OCR
设置流程 需训练 即刻使用 即刻使用
能否解析任意内容 不支持,仅限特定语言和行业 不能解析动态字段 支持
即时数据解析 需要训练时间 秒级完成 秒级完成
是否需人工审核 需要 不需要 不需要
灵活性 不支持,需从头训练 易于调整和排查 易于调整和排查
能否解析任意文档布局 支持 支持 不支持

全新体验——动态OCR!

动态OCR是怎样工作的?

这项新技术没有想象中复杂,我们把它做得尽量简单。该OCR引擎采用了“标签”概念。

什么是标签?

即使某个值在文档中移动,它始终会处于对应文本占位符附近。例如,下面的例子中,"$1,600.00"值始终在"Subtotal"文本旁边。

创建标签就像是为字段设置一个锚点。您只需教Parseur先定位标签,再根据标签位置识别目标字段。

小计字段位置会相对该标签。

动态OCR仅需几步即可完成

Dynamically adapt to moving fields with Dynamic OCR

步骤1:创建标签

创建标签与创建数据字段类似,只需在作为锚点的文本上画框,然后点击“创建新标签”。

步骤2:创建相对于标签的字段

在需提取的数据字段上画框,并告诉Parseur此字段相对于标签。

步骤3:可选创建第二个标签

您还可以添加第二个标签作为“终止标签”。Parseur会用此标签判断字段的结尾。

就是这么简单!每个需要提取的字段重复上述步骤,即可创建属于您的动态OCR模板。

在此了解更多关于动态字段的说明

动态OCR的优势

除了定位能力出众,动态OCR还具备多项优势,优于AI OCR和区域OCR。

数据准确率高

即使字段位置和大小变化,动态OCR都可精准提取数据。它可以定位并采集文档中移动的字段,准确率高于其他OCR工具。

设置快速简单

无须复杂设置。新Parseur用户信箱已默认启用动态OCR。

支持多种语言文档

该OCR工具可解析全球60多种语言的PDF和其他文档。

文档秒级处理

与需训练的AI模型不同,动态OCR可在几秒内完成PDF处理。

搭配Parseur使用动态OCR

Parseur是一款强大的PDF解析器,具备先进的OCR技术,可自动提取各类文档数据。Parseur数据处理无需任何解析规则或编程。

根据Parseur于2024年6月的基准测试显示,Parseur文档处理工具用户平均每月可节省约150小时的人工数据录入时间,节省约6413美元。—— Parseur统计,2024年6月

对比Parseur和其他PDF解析工具

注册您的免费账户
使用 Parseur 节省时间和精力。自动处理您的文档。

最后更新于

立即开始

告别手动录入,
就从今天起。

几分钟免费上手,亲自体验Parseur如何融入您的工作流。

无需训练模型
为真实业务场景打造
操作足够简单,API足够强大

常见问题解答

以下是关于动态OCR的所有解答。

您可以将OCR引擎应用于任何行业,但其中一些最典型的场景有:

  • 发票处理
  • 提单处理
  • PDF表格提取
  • PDF转Excel提取

我们提供免费方案,您可以体验所有可用功能。我们的价格方案采用“按需付费”模式,平均比其他PDF解析器便宜4倍

它无法自动解析新的文档布局。如果文档布局或格式有新变化,您需要新建一个模板。

当然可以!Parseur原生集成了ZapierMakePower Automate。您可以下载OCR引擎解析后的数据,或将其导出到任何应用(ERP、CRM、Webhooks等)。

可以!动态OCR技术可以提取表格数据,您还可以教Parseur表格的开始和结束位置。

支持!动态OCR已经针对60多种语言进行了训练,包括西班牙语、法语、日语、希伯来语、阿拉伯语、印地语等等。同时,还可实验性支持另外160多种语言。