自上次更新以来,我们不断突破自我,持续推出新功能。
过去一年,Parseur在AI能力、OCR表现、数据导出灵活性及整体用户体验等方面均做出了重大提升。从自定义AI指令到多语言支持,团队始终致力于让您的文档解析流程变得更高效、精准和可扩展。
AI解析引擎V3:更智能、处理更长文档、更高准确性
我们全新的AI解析引擎升级带来了:
- 处理长文档能力显著增强:现在可高效处理复杂、多页大文档,具备更优异的记忆和版式理解。
- 定制指令执行更精准:自定义AI指令可实现更精确的字段抽取。
- 更强的版面结构理解:尤其适合处理布局混乱或格式不一的文件。
支持Google账号一键登录注册
现在,您可直接用Google账号注册及登录Parseur,无需再记一堆密码。
早前用Gmail邮箱注册的用户,也可以一键切换至Google登录,享受更简便、安全的接入体验。
更智能的AI:支持元数据与自定义参数
AI指令现已更加强大:
自定义API参数调用,通过
Custom:
前缀使用→ 示例:
Custom:supplier_name
在指令中灵活使用文档元数据,采用
metadata:
前缀→ 支持字段包括:Sender、SenderName、Recipient、Subject、PageCount 等
新集成:Parseur n8n 连接器(测试版)
您现在可通过n8n(开源自动化平台)实现文件收发。
只需前往邮箱设置 > 导出 > n8n页签即可开始。
此集成当前处于测试阶段,正在n8n团队审核中。
新增可搜索PDF链接元数据
现在,您可以直接从元数据访问洁净、可全文搜索的PDF版本。
- 自动校正页面旋转方向
- 区域OCR强化文本,可全文检索
- 如无需OCR,将返回原始PDF
字段级自定义AI指令
AI解析器现支持为每个字段单独设置定制指令,数据提取更加灵活、智能、准确。
AI字段指令适用场景包括:
- 为歧义字段加注语境说明
- 限定仅从指定列表内容中选取
- 摘要某一内容板块
- 自动翻译指定文本字段
针对长文档专属优化的AI引擎
Parseur现能解析最长100页文档,解析更精确、速度更快。非常适用于合同、技术文档、多页发票等场景。
新功能!图片文件文本提取
Parseur现在支持多种图片格式的文字抽取:
- PNG、JPEG、TIFF、BMP、GIF
无论是扫描件、身份证照片还是拍摄文档,Parseur都可高效提取文本数据。
开启:邮箱设置 > 处理 > 启用图片文件处理。
多表格区域OCR识别率提升
全新区域OCR升级,显著优化了多行表格的合并与提取准确度,财务报表与订单摘要等用户尤为受益。
自动识别数字与日期格式
Parseur现可自动识别各地区数字、日期格式:
- 日期格式:MM/DD/YYYY 与 DD/MM/YYYY
- 数字分隔:1,234.56 与 1.234,56
跨地域数据流转更加顺畅无忧。
可自定义导出字段顺序及下载
数据导出时,现可灵活自定义字段显示顺序,支持:
- Excel
- CSV
- Google Sheets
助力工作流自动化,便于报告规范统一。
Parseur全面支持多语言
Parseur平台及官网当前支持10多种语言,包括:
🇫🇷 法语 | 🇩🇪 德语 | 🇨🇳 中文 | 🇯🇵 日语 | 🇳🇱 荷兰语 | 🇮🇹 意大利语 | 🇵🇹 葡萄牙语 | 🇪🇸 西班牙语
可在用户个人设置中切换界面语言。
提示:当前翻译由AI驱动,部分表述可能略有误差。
新增文档格式支持:.mbox
现在Parseur可直接处理.mbox
格式文件,便捷解析合并邮件,适用日志和归档处理场景。
AI版面空间感进一步提升
全新AI引擎带来:
- 更强的文档结构理解与区分
- 更智能地执行定制字段指令
- 对各类扫描件和复杂布局适应能力大幅提升
更智能的数据提取能力
复杂国际化格式处理大幅增强,涵盖:
- 金额:$1,234.56、₹-7,50,721.05、(1.234,56€)等多币种金额
- 日期:显著提升对中、日、韩等区域日期格式的准确解析
PDF解析速度再创新高
Parseur现可更快、更高效地处理大体量PDF文档,大幅降低延迟和高并发下的出错率,确保解析高准确性。
零停机服务器迁移
我们顺利完成了零宕机的基础设施迁移升级,极大提升平台稳定性和扩展能力,您的业务流程畅通无阻。
文档视图与元数据管理体验优化
我们对文档展示和元数据标签体系进行了全面优化,进一步增强了搜索、审计与数据全流程追溯能力。
最后更新于