包含内容
邮箱级模式
模式保持一致,下游集成与自动化才能稳定运行。字段定义一次,邮箱处理的每份文档都映射到相同的结构。
- 标准字段采集单值,表格字段处理重复数据
- 用自然语言告诉AI每个字段要抓什么
- 随时在界面调整,也可用API编程操作
字段级格式化
内置格式自动规范化日期、数字、地址等字段。系统按文档上下文推断格式,邮箱级默认值作为兜底,确保输出统一。
- 日期支持任意顺序、分隔符和多语言月份名称
- 数字解析任意千分位、小数分隔符,覆盖各地区写法
- 地址字段自动地理定位,拆分为结构化片段
数据验证
每条提取结果按邮箱模式自动校验。失败会在界面警告、发送邮件、触发Webhook,第一时间通知团队与工具。
- 模式校验确认AI提取结果符合字段结构
- 必填项检查,源头捕捉漏填数据
- 选项字段校验,标出超出允许范围的值
后处理规则
当内置格式和校验不够用时,可加入一小段Python脚本。脚本在提取和校验之后执行,按业务逻辑重塑数据或做自定义校验。
- 可组合、拆分或基于提取值计算新字段
- 支持业务逻辑、数据查表、条件转换
- Pro及以上方案支持
数据规范化如何运作
刚刚发生了什么
多引擎文档解析
Vision AI、Text AI、模板或OCR从每份文档中抽取出结构化字段。
映射到模式
提取出的字段会自动映射到邮箱中已定义的字段集合。不论原始文档版式差异多大,最终输出都是相同的列结构。
格式化
每个字段按配置的格式处理。日期与数字依文档上下文规范化,姓名拆分为姓、名等组件,地址解析为结构化片段。
验证
每条结果在进入下一步之前都先过一遍校验。通过的进入后处理,未通过的会被标记出来,不会悄无声息地流出Parseur。
后处理
可选的Python规则在最后执行,处理字段级格式无法表达的业务逻辑。合并字段、查询参考数据,或把输出精准对齐下游契约。
接下来会发生什么
实时导出与集成
规范化的数据实时传送到您的CRM、财务系统或数据库。