동적 OCR: 고급 문서 데이터 추출

동적 OCR은 문서에서 데이터 포인트를 추출하는 가장 진보된 기술입니다. 문서마다 위치가 이동하거나 크기가 변하는 필드를 동적으로 찾아낼 수 있습니다.

언제 동적 OCR이 필요할까요?

문서 레이아웃은 비슷하더라도 필드의 위치나 크기가 상황에 따라 달라질 수 있을 때 동적 OCR이 필요합니다.

필드 위치가 유동적일 때

테이블이나 선택 항목 같은 요소들로 인해 필드 위치가 문서마다 변경될 수 있습니다.

테이블 이후 필드

행 개수가 가변적인 테이블의 경우, 그 아래 필드들의 위치가 달라질 수 있습니다.

선택적 필드가 있을 때

"address 2"와 같은 선택사항이나, 상품의 크기/색상 등 옵션들에 따라 이후 정보의 위치 역시 달라집니다.

필드 크기가 유동적일 때

대부분의 필드는 문서에서 고정된 크기를 가지지만, 여러 줄의 입력란이나 행이 많은 테이블 등에서는 크기가 달라질 수 있습니다.

테이블 행 개수 변화

테이블의 행 수가 문서마다 다르기 때문에, 어떤 영역까지가 테이블인지 구분할 수 있어야 합니다.

여러 줄의 텍스트 필드

메모 또는 자유 형식 코멘트 등은 줄 수가 문서마다 다릅니다. 추출 도구가 필드의 종료 지점을 정확히 식별해야 합니다.

동적 OCR은 어떻게 작동하나요?

동적 OCR에서는 '레이블'이라는 앵커 개념을 활용합니다. 레이블은 문서 내에서 특정 필드 위치의 기준점이 될 수 있는 텍스트입니다. 영역 OCR이 필드의 고정 위치를 찾는 것과 달리, Parseur는 먼저 레이블을 찾아내고, 해당 기준을 중심으로 필드를 동적으로 추출합니다.

1

레이블 생성

앵커로 삼을 텍스트에 박스를 그리고 '레이블 생성'을 클릭해 기준점을 만들 수 있습니다.
2

필드 생성 및 레이블 연동

추출할 데이터 위에 박스를 그리고 필드 이름을 정한 다음, 옵션에서 연결할 레이블을 지정하면, Parseur가 필드의 위치를 레이블을 기준으로 동적으로 판단해줍니다.
3

종료 레이블 생성 (선택)

필드 크기가 가변적인 경우, 필드 끝부분에도 추가 레이블을 설정해 '종료 레이블'로 사용할 수 있습니다. Parseur는 이 두 레이블 사이를 데이터 범위로 인식합니다.

반복

모든 필드에 대해 동일하게 적용할 수 있습니다. 하나의 레이블을 여러 필드가 공유할 수 있으며, 레이블과 필드는 필수/선택 상태로 세분화할 수 있습니다.

가장 지능적인 문서 처리 소프트웨어

동적 OCR과 다양한 데이터 추출 기능의 결합으로 Parseur는 문서 자동화에 최적화된 강력한 데이터 추출 플랫폼입니다.

최고 수준의 OCR 소프트웨어

Parseur OCR은 업계 최고 수준의 정확도를 제공하며, 대부분의 언어와 필기체까지 지원합니다. 처리 속도도 뛰어납니다.

강력한 템플릿 엔진

다양한 템플릿을 등록해 자동으로 문서 레이아웃을 식별하고, 각기 다른 형식에서 데이터 추출이 가능합니다.

영역 OCR

문서 내 고정 위치에 있는 텍스트도 영역 OCR을 활용해 정확하게 추출할 수 있습니다.

AI 기반 데이터 추출 소프트웨어.
오늘 바로 Parseur를 시작하세요.

이메일, PDF, 스프레드시트에서 텍스트 추출을 자동화하세요.
수백 시간의 반복 업무를 절감할 수 있습니다.
AI로 업무 자동화를 경험해 보세요.

Parseur rated 5/5 on Capterra
Parseur.com has the highest adoption on G2
Parseur.com has the happiest users badge on Crozdesk
Parseur rated 5/5 on GetApp
Parseur rated 4.5/5 on Trustpilot