什么是动态OCR?
动态OCR 是 Parseur 开发的新一代先进OCR引擎。虽然AI OCR和区域OCR在数据提取方面表现出色,但各有局限。为解决这些问题,Parseur 推出了动态OCR,让您的数据提取流程更加流畅轻松。
区域OCR的局限性
区域OCR是从文档指定“区域”提取数据的工具。当数据字段处于固定位置时,该OCR工具效果最佳。区域OCR的缺点包括:
- 无法提取在不同文档中动态变化位置的数据
- 无法处理字段尺寸变化的情况
- 难以准确识别扫描质量较差的文档
了解更多:区域OCR是什么
文档中有动态变化的字段怎么办?
像“表格行”“表格项”“合计”或“小计”等字段,取决于表格里项目的数量。在您的发票或采购订单(PO)中,这些字段通常不会永远处于相同的位置。
当字段水平或垂直移动,或者大小变化时,区域OCR难以准确获取数据。这是因为区域OCR只能在“区域”位置固定时发挥优势。
字段位置经常变化时,如何保证数据提取的准确性?
以财务数据为例,每月的财务报表都因成本、收入和利润等变动而不同。如果您需要快速进行财务审计并获取所需数据,区域OCR可能不是最佳方案。
但AI OCR不比动态OCR更好吗?
阅读我们的AI OCR完整指南,进一步了解对比情况。
全球OCR市场预计将在 2023年至2030年间以14.8%的复合年增长率快速增长。
AI OCR是第一代OCR技术,结合同机器学习和计算机视觉算法。AI引擎会利用神经网络定位数据提取字段。
AI OCR的局限性
AI OCR确实改变了数据提取和分析流程,但也有自身不足。
需要人工审核
将AI OCR软件集成到工作流时,通常建议增加人工数据审核环节。因为AI工具具有概率性,所以流程较慢,总要有人介入推动。
需要训练
您需要先训练AI模型,才能正式使用。整个训练过程耗时,尤其当待处理数据量大时,有些AI OCR需要多达4小时训练。
黑盒
如果AI模型出现故障,您只能重新训练,无法自定义回溯工具。
AI OCR价格昂贵
基于AI的OCR软件通常价格较高,更适合大型企业。如果您是中小企业或个人,可能不是最佳选择。
区域OCR vs AI OCR vs 动态OCR
我们总结了不同类型OCR引擎的主要区别:
| AI OCR | 区域OCR | 动态OCR | |
|---|---|---|---|
| 设置流程 | 需训练 | 即刻使用 | 即刻使用 |
| 能否解析任意内容 | 不支持,仅限特定语言和行业 | 不能解析动态字段 | 支持 |
| 即时数据解析 | 需要训练时间 | 秒级完成 | 秒级完成 |
| 是否需人工审核 | 需要 | 不需要 | 不需要 |
| 灵活性 | 不支持,需从头训练 | 易于调整和排查 | 易于调整和排查 |
| 能否解析任意文档布局 | 支持 | 支持 | 不支持 |
全新体验——动态OCR!
动态OCR是怎样工作的?
这项新技术没有想象中复杂,我们把它做得尽量简单。该OCR引擎采用了“标签”概念。
什么是标签?
即使某个值在文档中移动,它始终会处于对应文本占位符附近。例如,下面的例子中,"$1,600.00"值始终在"Subtotal"文本旁边。
创建标签就像是为字段设置一个锚点。您只需教Parseur先定位标签,再根据标签位置识别目标字段。
小计字段位置会相对该标签。
动态OCR仅需几步即可完成
步骤1:创建标签
创建标签与创建数据字段类似,只需在作为锚点的文本上画框,然后点击“创建新标签”。
步骤2:创建相对于标签的字段
在需提取的数据字段上画框,并告诉Parseur此字段相对于标签。
步骤3:可选创建第二个标签
您还可以添加第二个标签作为“终止标签”。Parseur会用此标签判断字段的结尾。
就是这么简单!每个需要提取的字段重复上述步骤,即可创建属于您的动态OCR模板。
动态OCR的优势
除了定位能力出众,动态OCR还具备多项优势,优于AI OCR和区域OCR。
数据准确率高
即使字段位置和大小变化,动态OCR都可精准提取数据。它可以定位并采集文档中移动的字段,准确率高于其他OCR工具。
设置快速简单
无须复杂设置。新Parseur用户信箱已默认启用动态OCR。
支持多种语言文档
该OCR工具可解析全球60多种语言的PDF和其他文档。
文档秒级处理
与需训练的AI模型不同,动态OCR可在几秒内完成PDF处理。
搭配Parseur使用动态OCR
Parseur是一款强大的PDF解析器,具备先进的OCR技术,可自动提取各类文档数据。Parseur数据处理无需任何解析规则或编程。
根据Parseur于2024年6月的基准测试显示,Parseur文档处理工具用户平均每月可节省约150小时的人工数据录入时间,节省约6413美元。—— Parseur统计,2024年6月
最后更新于