동적 OCR이란 무엇인가요?

동적 OCR이란?

동적 OCR은 Parseur가 개발한 새로운 고급 OCR 엔진입니다. 기존 AI OCR이나 영역 OCR도 데이터 추출에는 효과적이지만, 각각의 한계도 있습니다. Parseur는 이러한 한계를 해소하기 위해 동적 OCR을 도입하여 데이터 추출 과정을 더욱 원활하게 만들었습니다.

총합 필드가 수직으로 이동하는 송장

영역 OCR의 한계

영역 OCR은 문서 내 특정 "영역"에서만 데이터를 추출합니다. 데이터 필드가 고정된 위치에 있어야 효과적으로 작동합니다. 영역 OCR의 단점은 다음과 같습니다:

  • 문서마다 위치가 달라지는 동적 데이터를 추출할 수 없습니다.
  • 크기가 달라지는 필드를 처리할 수 없습니다.
  • 스캔 품질이 낮은 문서는 정확하게 인식하지 못할 수 있습니다.

영역 OCR에 대해 자세히 알고 싶다면 영역 OCR이란?을 참고하세요.

문서마다 필드 위치가 계속 움직이나요?

"테이블 행", "테이블 라인", "총액" 또는 "소계"와 같은 필드는 테이블 항목의 수에 따라 위치가 달라집니다. 이들은 송장이나 발주서(PO)마다 고정된 위치에 있지 않습니다.

필드가 수평·수직으로 이동하거나 크기가 달라질 때 영역 OCR로는 정확히 데이터를 추출하기 어렵습니다. 영역 OCR은 "영역"이 항상 같은 위치에 있어야 제대로 작동하기 때문입니다.

계속 변하는 필드 위치에서 정확한 데이터 추출 방법은?

예로, 월별 재무 데이터를 보면 이번 달과 저번 달의 비용, 수익, 이익 위치가 계속 달라질 수 있습니다. 빠른 재무 감사나 즉각적인 데이터 추출이 필요하다면 영역 OCR로는 한계가 있습니다.

그런데, AI OCR이 동적 OCR보다 좋은가요?

AI OCR 안내서에서 두 기술의 차이를 자세히 알아보세요.

글로벌 OCR 시장은 2023년부터 2030년까지 연평균 14.8% 성장이 예상됩니다.

AI OCR은 1세대 OCR로서, 머신러닝 및 컴퓨터 비전 알고리즘의 조합을 사용합니다. 신경망을 통해 데이터 추출을 위한 필드를 감지합니다.

AI OCR의 단점

AI OCR로 데이터 추출과 분석이 크게 발전했지만, 몇몇 한계도 존재합니다.

수동 검토가 필요함

AI OCR 소프트웨어를 도입하는 경우, 수작업 데이터 검토 단계를 반드시 포함하는 것이 좋습니다. AI 툴은 확률적이기 때문에, 처리 시간이 길어지고 항상 누군가의 확인이 필요할 수 있습니다.

학습이 필요함

AI 모델을 실제로 사용하려면 사전 학습이 필요합니다. 학습 과정 자체에 상당한 시간이 걸리기도 합니다. 데이터가 많을 경우, 학습에 최대 4시간까지 소요될 수 있습니다.

블랙박스

AI 모델이 어느 순간 실패한다면, 사용자는 모델을 재학습하는 방법 외에는 달리 조치할 수 없습니다. 내부 로직을 수정할 수 없습니다.

AI OCR은 비용이 높음

AI 기반 OCR 소프트웨어는 일반적으로 고가이며, 대기업에 적합합니다. 소규모 사업자나 개인에게는 적합하지 않을 수 있습니다.

영역 OCR vs AI OCR vs 동적 OCR

각 OCR 엔진의 주요 차이점을 정리하면 다음과 같습니다:

AI OCR 영역 OCR 동적 OCR
설정 학습 필요 즉시 사용 즉시 사용
모든 콘텐츠 파싱 가능 아니오(특정 언어 및 분야 한정) 아니오(이동/크기 가변 필드 불가)
즉시 데이터 파싱 아니오(모델 학습 필요) 예(수초 이내 완료) 예(수초 이내 완료)
수동 데이터 검토 필요 아니오 아니오
유연성 아니오(블랙박스, 완전 재학습 필요) 예(문제 해결 및 조정 용이) 예(문제 해결 및 조정 용이)
모든 문서 레이아웃 파싱 아니오

동적 OCR의 등장!

동적 OCR은 어떻게 작동하나요?

동적 OCR은 최대한 단순하게 설계된 최신 기술입니다. 이 엔진은 "라벨" 개념을 사용합니다.

라벨이란?

값이 문서 내에서 이동하더라도 항상 특정 텍스트(플레이스홀더)와 동일한 위치 관계를 갖습니다. 예를 들어, "$1,600.00"은 언제나 "Subtotal" 텍스트 옆에 놓이게 됩니다.

라벨을 생성하면 기준점 역할을 합니다. Parseur는 라벨부터 찾아낸 후, 해당 위치를 바탕으로 데이터 필드를 찾습니다.

소계 필드는 이 라벨과의 상대적 위치에 있습니다.

동적 OCR은 몇 단계만으로 설정할 수 있습니다

동적 OCR로 동적으로 이동하는 필드를 간편하게 추출

1단계: 라벨 생성

데이터 필드의 텍스트 위를 드래그해 박스를 그린 후 "새 라벨 만들기"를 클릭하면 기준 라벨을 생성할 수 있습니다.

2단계: 라벨과 연계된 필드 생성

추출하고 싶은 데이터 필드를 드래그해 박스를 만든 다음, 이 필드가 라벨과 연계되어 있음을 Parseur에 알려줍니다.

3단계: 두 번째 라벨(선택 사항)

필요하다면 "종료 라벨"을 추가할 수 있습니다. Parseur는 이 라벨을 이용해 필드의 마지막 위치를 파악합니다.

이 단계를 반복하여 추출이 필요한 모든 필드를 위한 동적 OCR 템플릿을 만들어 주세요.

동적 필드에 대한 자세한 안내 보기

동적 OCR의 장점

우수한 현지화 능력뿐만 아니라, 동적 OCR은 AI OCR 및 영역 OCR과 비교해 다양한 이점을 제공합니다.

높은 데이터 정확도

필드 크기·위치 변동이 있어도 정확하게 데이터를 추출할 수 있습니다. 어디로 이동하든 데이터 누락이 없습니다.

빠르고 손쉬운 셋업

복잡한 설정은 필요 없습니다. Parseur 신규 사용자는 동적 OCR이 기본 활성화되어 있습니다.

다양한 언어 지원

OCR 엔진은 전 세계 60개 이상의 언어로 된 PDF 및 문서를 처리할 수 있습니다.

신속한 문서 처리

AI 모델 학습 대비, 동적 OCR은 어떤 PDF 파일이든 즉시 빠르게 처리할 수 있습니다.

Parseur에서 동적 OCR 활용하기

Parseur는 첨단 OCR 기술을 적용한 강력한 PDF 파서로, 문서에서 데이터를 자동화하여 추출합니다. 데이터 처리에 별도의 파싱 규칙이나 개발이 필요하지 않습니다.

2024년 6월 Parseur 벤치마크 기준, Parseur 문서 처리 도구를 이용한 고객은 매월 평균 150시간의 수동 데이터 입력 시간과 약 $6,413의 비용을 절감했습니다. - Parseur 통계, 2024년 6월

다른 PDF 파서와 Parseur 비교하기

무료 계정 만들기
Parseur로 시간과 노력을 절약하세요. 문서 처리를 자동화하세요.

마지막 업데이트

시작하기

문서 수작업,
오늘 끝내세요.

무료로 시작해, Parseur가 실제 업무에 어떻게 맞아 들어가는지 직접 확인해 보세요.

모델 학습 필요 없음
실제 업무 흐름에 맞춘 설계
클릭 몇 번으로 시작, API로 확장

자주 묻는 질문

동적 OCR에 대해 자주 묻는 질문과 답변을 정리했습니다.

OCR 엔진은 모든 산업에서 사용할 수 있지만, 저희가 선호하는 몇 가지 예시는 다음과 같습니다:

  • 송장 처리
  • 선하증권
  • PDF 테이블 추출
  • PDF에서 엑셀로 데이터 추출

모든 기능을 사용할 수 있는 무료 플랜이 있습니다. 저희 요금제는 "성장에 따라 지불(pay-as-you-grow)" 방식이며, 평균적으로 다른 PDF 파서보다 4배 저렴합니다.

새로운 레이아웃을 자동으로 파싱할 수 없습니다. 문서 양식이나 포맷이 새로워질 경우 새 템플릿을 만들어야 합니다.

예! Parseur는 Zapier, Make, Power Automate와 네이티브 통합을 제공합니다. OCR 엔진으로 추출한 데이터를 다운로드하거나, 어떤 애플리케이션(ERP, CRM, Webhooks)으로도 내보낼 수 있습니다.

네! 동적 OCR 기술을 통해 테이블 데이터 추출이 가능하며, Parseur에 테이블의 시작과 끝도 지정해줄 수 있습니다.

네! 동적 OCR은 이미 60개 이상의 언어로 학습되었습니다. 스페인어, 프랑스어, 일본어, 히브리어, 아랍어, 힌디어 등 다양한 언어가 지원됩니다. 이 외에 160개 이상의 언어에 실험적 지원을 제공합니다.