다중 엔진 문서 파싱

모든 문서에는 그에 맞는 파싱 엔진이 있습니다

Vision AI는 시각적 레이아웃, Text AI는 일반 텍스트, 템플릿은 고정 양식을 처리합니다. 세 엔진이 하나의 메일함에서 함께 작동합니다.

포함된 기능

Vision AI 추출

Vision AI는 문서를 이미지로 인식해 전체 페이지의 레이아웃과 시각적 맥락을 함께 읽습니다. 이미지 형태의 PDF, 스캔본, 복잡한 양식까지 사람이 보는 방식 그대로 처리합니다.

  • 복잡한 PDF, 스캔, 양식에 최적
  • 필기, 체크박스, 도장까지 인식
  • 영어 지시문만으로 설정, 템플릿 불필요

Text AI 추출

문서가 먼저 일반 텍스트로 변환되며, 텍스트 레이어가 없으면 OCR이 자동 적용됩니다. Text AI는 추출된 텍스트만 분석하므로 형식이나 레이아웃의 영향을 받지 않습니다.

  • 이메일, 텍스트 기반 PDF에 적합
  • 시각적 레이아웃이 필요 없을 때 사용
  • 영어 지시문만으로 설정, 템플릿 불필요

템플릿 기반 추출

메일함마다 필요한 만큼 템플릿을 만들 수 있습니다. Parseur가 문서에 가장 잘 맞는 템플릿을 자동 선택해 매번 동일한 결과를 보장하며, 이 방식은 AI를 사용하지 않습니다.

  • 규격화된 양식, 시스템 발송 메일에 이상적
  • 고정 레이아웃에 가장 높은 정확도
  • 시각적 템플릿 에디터로 설정 가능

표 및 라인 아이템 추출

표의 각 행이 별도 레코드로 추출되어 스프레드시트에서 바로 활용할 수 있습니다. 세 가지 파싱 엔진 모두 지원하며, 스프레드시트 파일은 자동으로 표로 파싱됩니다.

  • 문서마다 행 수가 달라도 자동 대응
  • 여러 페이지에 걸친 표도 추출 가능
  • 복잡한 다행 셀도 개별 필드로 정확히 추출

스캔과 이미지를 위한 OCR

OCR(광학 문자 인식)이 스캔본, 휴대폰 사진, 이미지 PDF에서 텍스트를 추출합니다. 텍스트 레이어가 없는 문서도 Text AI와 템플릿 엔진이 처리할 수 있는 형태로 만들어 줍니다.

  • 스캔본, 휴대폰 사진, 이미지 PDF 지원
  • 200개 이상 언어와 필기 인식
  • 영역 OCR과 동적 OCR로 유연한 레이아웃 대응

문서 전처리

정확한 파싱은 깨끗한 입력에서 시작됩니다. Parseur는 들어오는 문서를 먼저 자동으로 정리·복구한 뒤 추출에 들어갑니다. 이 전처리 기술은 1억 건 이상의 실제 문서와 10년 이상의 운영 노하우로 검증되었습니다.

  • 기울어진 스캔 자동 교정, 흐린 텍스트 복원
  • 손상된 PDF와 비정상 인코딩도 자동 복원
  • 국가별 날짜·숫자 형식 자동 인식

문서 파싱 작동 방식

방금 일어난 일

문서 수집

문서가 업로드, 이메일, API 또는 연결된 저장소를 통해 자동으로 들어왔습니다.

자세히 알아보기
1

전처리

모든 문서는 먼저 정제 과정을 거칩니다. Parseur가 페이지 방향을 바로잡고, 기울어진 스캔을 교정하며, 흐린 텍스트를 복원해 문서 품질을 끌어올립니다.

9° 기울임
준비 완료
2

OCR

스캔본, 휴대폰 사진, 이미지 PDF는 OCR로 텍스트가 추출됩니다. 이미 텍스트 레이어가 있는 문서는 이 단계를 자동으로 건너뜁니다.

청구서 #Q2-8821
아크미㈜
April 15, 2026
마감 May 15
발신자
아크미㈜
acme.co.kr
수신처
글로벡스㈜
서울 강남
OCR 스캔 중
3

엔진 선택

파싱 엔진이 자동으로 선택됩니다. 일치하는 템플릿이 있으면 템플릿이 우선 적용되고, 없으면 Vision AI(이미지 중심) 또는 Text AI(텍스트 중심)가 사용됩니다.

템플릿
AI 비전
AI 텍스트
4

추출

선택된 엔진이 미리 정의한 스키마에 맞춰 필드를 구조화해 추출합니다. 이 데이터는 곧이어 정규화 단계로 전달되어 포맷팅과 검증을 거칩니다.

청구서 #Q2-8821 청구서 번호
아크미㈜
고객
5월 14, 2026
날짜
마감 May 15
발신자
아크미㈜
acme.co.kr
수신처
글로벡스㈜
서울 강남
항목 품목 수량 단가 컨설팅 2 ₩50,000 장비 1 ₩30,000 초기 설정비 3 ₩40,000
소계 ₩250,000
부가세 ₩25,000
합계 ₩275,000 합계
추출 중

다음 단계

데이터 정규화 및 검증

추출된 필드는 검증과 포맷팅을 거쳐 후속 워크플로우에 맞게 구조화됩니다.

자세히 알아보기
시작하기

문서 파싱, 이제 자동으로.

샘플을 업로드하고 필드만 정의하면, Vision AI, Text AI 또는 템플릿이 알아서 데이터를 추출합니다.

무료 플랜 포함, 신용카드 불필요
2분 이내 첫 문서 처리
약정 없이 언제든 해지 가능

자주 묻는 질문

Vision AI, OCR, 템플릿, 표 추출, 다국어 지원 등 Parseur 파싱 엔진에 관한 주요 질문을 확인하세요.

문서 파싱은 PDF, 스캔, 이메일 등 비정형 문서에서 구조화된 필드를 추출해, 스프레드시트, 데이터베이스, 연동 도구에서 수작업 없이 바로 활용할 수 있도록 만드는 과정입니다. Parseur는 Vision AI, Text AI, 템플릿 세 가지 엔진을 구동하며 각 문서에 가장 적합한 방식을 자동으로 선택합니다.

Vision AI는 페이지를 이미지로 인식해 전체 레이아웃(필기, 체크박스, 도장, 시각적 신호 포함)을 분석합니다. 복잡한 구조의 PDF, 스캔, 양식에 적합합니다. Text AI는 문서의 일반 텍스트만 분석하고 레이아웃을 무시하며, 이메일이나 텍스트 기반 PDF 등 텍스트 중심 문서에 적합합니다.

네. 문서 레이아웃별로 원하는 만큼 템플릿을 추가할 수 있습니다. 새 문서가 도착하면 Parseur가 가장 잘 맞는 템플릿을 자동으로 적용해, 하나의 메일함에서 다양한 고정 레이아웃을 한 번에 처리합니다. 일치하는 템플릿이 없으면 Vision AI나 Text AI가 자동으로 이어 받아 파싱합니다.

네. 스캔본, 휴대폰 사진, 이미지 전용 PDF는 내장 OCR로 처리되며, Vision AI는 일반 텍스트 추출 도구가 놓치는 필기, 체크박스, 도장 같은 시각 요소도 인식합니다.

네. 표의 각 행이 별도 레코드로 추출되어 텍스트가 한 줄로 합쳐지지 않습니다. 표 추출은 세 가지 파싱 엔진 모두에서 동작하며, 행 수가 매번 달라도 자동 대응하고 여러 페이지에 걸친 표도 지원합니다. 원본이 스프레드시트라면 자동으로 표로 추출됩니다.

정확도는 엔진과 문서에 따라 달라집니다. 템플릿은 고정 레이아웃에서 매번 동일한 결과를 보장합니다. Vision AI는 복잡한 시각 구조, Text AI는 텍스트 중심 문서를 다룹니다. 전처리 단계에서 기울어진 스캔, 흐린 텍스트, 인코딩 오류, 손상된 PDF 등을 복구하고, 결과 데이터는 내보내기 전 Parseur에서 검증을 거칩니다.

샘플 문서를 업로드하면 Parseur가 추출할 만한 필드를 자동으로 제안합니다. 이후 원하는 필드를 다듬고, 각 필드별로 영어로 간단한 지시문을 입력하면 됩니다. AI가 이 지시문을 참고해, 새로 들어오는 다양한 레이아웃의 문서에서도 올바른 값을 추출합니다. 직접 모델을 학습시키거나 코드를 작성할 필요가 없습니다.

아닙니다. Vision AI와 Text AI 모두 영어로 간단한 지시문만 입력하면 설정이 끝나며 템플릿이 필요하지 않습니다. 다만 매번 동일한 결과가 필요한 고정 양식(예: 시스템 발송 양식)에는 템플릿을 사용할 수 있습니다.

네. 스캔본, 휴대폰 사진, 이미지 전용 PDF에는 OCR을 자동 실행해 파싱 엔진에 텍스트 레이어를 제공합니다. 이미 텍스트 레이어가 있는 문서는 OCR을 건너뜁니다.

OCR은 200개 이상의 언어와 필기를 지원합니다. AI 엔진은 모든 주요 언어로 된 문서를 이해하며, 국가별 날짜·숫자 포맷도 문서 맥락에서 자동으로 인식합니다.

네. Vision AI와 Text AI는 공급사별 템플릿 없이도 레이아웃 변화에 자동으로 적응합니다. 하나의 메일함에서 다양한 양식의 청구서나 영수증을 문제없이 처리할 수 있습니다.

가입 후 메일함을 만들고 샘플 PDF를 업로드하세요. 처음 업로드하면 Parseur가 추출할 필드를 자동으로 제안합니다. 이후 언제든 필드와 영어 지시문을 수정할 수 있습니다. 문서에 맞는 파싱 엔진이 자동 선택되며, 추출 데이터는 Google Sheets, CRM, 데이터베이스, 커스텀 엔드포인트 등으로 코딩 없이 내보낼 수 있습니다.