OCR(Optical character recognition, 광학 문자 인식)은 이미지(사진) 속 글자 위치를 찾고 어떤 글자인지 자동으로 알아내는 기술입니다. OCR은 다양한 형태의 글자를 이해하기 위해 독자적인 글자 영역 검출 및 인식 기술을 보유하고 있습니다. 또한 손쉽게 템플릿을 만들고 원하는 영역을 지정한 뒤, 필요한 글자만 빠르게 추출하는 기능을 제공합니다.
CLOVA OCR 서비스는 네이버의 AI 기술을 활용하여 주요 비즈니스 활용에 최적화된 고성능 OCR 인식 모델을 적용하였습니다. 문자 인식이 제공되는 언어는 한국어, 영어, 일본어이며, 필기체 인식은 한국어와 일본어가 지원됩니다.
CLOVA OCR은 문서 레이아웃 분석 및 글자를 읽는 순서 방향을 추정하여 둥글게 곡선으로 배열되거나 기울어진 문자, 필기체 인식 등 고성능 AI 모델 바탕으로 높은 수준의 정확도를 제공합니다. OCR분야 가장 권위있는 글로벌 챌린지ICDAR2019 4개 분야에서 1위, CVPR 및 ICCV 국제학회 논문 선정 등 독보적 기술력이 집약된 CLOVA OCR을 네이버 클라우드 플랫폼을 통해 손쉽게 이용할 수 있습니다.
등록된 템플릿과의 유사도를 통해 사용자의 개입없이 문서의 자동 분류가 가능하므로 효과적인 업무 워크플로우를 설계할 수 있습니다. CLOVA OCR 서비스는 인식된 텍스트의 값을 검증할 수 있어 반복 검증 업무를 줄이고 신뢰도를 높일 수 있습니다. 또한 Papago 서비스 등 다른 서비스와 연계하여 고객에게 차별화된 서비스를 제공할 수 있습니다.
단순한 문자 인식을 넘어 문서 유형을 분류하고 구조화된 형태로 문자를 추출합니다. 고객이 이미지 데이터(사진)를 RESTful API 방식으로 전달하면, 해당 이미지를 분석하여 텍스트 추출 결과를 JSON 형태로 제공합니다.
고객이 이미지 데이터(사진)를 RESTful API 방식으로 전달하면, 해당 이미지를 분석하여 텍스트 추출 결과를 JSON 형태로 제공합니다.
항목 | 내용 |
---|---|
이미지 내의 Text 탐지 | 이미지 파일 형식은 현재 JPG, PNG, PDF, TIFF 형식을 지원하며, 지원 포맷은 계속 확대될 예정입니다. |
인식 템플릿 | 서식 문서 에서 인식을 원하는 영역을 설정 하면, 구조화된 값으로 추출하여 정형화된 인식 결과를 전송합니다. OCR 빌더에서 다양한 인식 템플릿을 설정하고, 서비스에 배포가 가능합니다. |
인식값 검증 | 검증이 필요한 이미지의 판독 값에 대해서 외부 검증 서버와 연동될 수 있도록 검증 연동 End-point를 제공합니다. |
멀티 박스 | 여러 개의 글자 입력 박스들을 조합하여 인식하는 멀티 박스(예: 우편번호) 기능을 제공합니다. |
체크 박스 | 체크 표시를 인식할 수 있는 체크 박스 기능을 제공합니다. |
도메인 복사 | 도메인을 설정값을 복사하여 기존 템플릿을 그대로 유지한 새로운 도메인 생성 및 플랜 변경이 가능합니다. |
※ 이미지 파일 사이즈는 20MB 이하로 제한됩니다.
인식 모델 | 베이직 | 프리미엄 | 설명 |
---|---|---|---|
모델 인식률 | 활자체 및 필기체 인식 | 활자체 및 필기체 인식 | 주요 비즈니스 활용에 최적화된 고성능 OCR 인식 모델을 제공 |
적합 문서 | 증명서, 고정 폼 양식 | 수기 신청서 가입 양식, 금융 문서 등 | |
인식 템플릿 레이아웃 | 제공 | 제공 | 인식 영역을 설정 |
멀티박스 | 제공 안함 | 제공 | 싱글 박스 템플릿을 조합하여 번호 인식영역 등을 제어 |
체크박스 | 제공 안함 | 제공 | 체크 박스 형태의 인식 제공 |
필드 유형 | 제공 안함 | 제공 | 인식 값을 숫자로만 인식되도록 유형을 설정 |
많은 학습데이터를 기반으로 CLOVA AI 기술을 적용하여 문서의 주요 Feature를 추출합니다.영수증/신용카드/사업자등록증/명함/신분증이 제공되며, 계속적으로 Document OCR 모델이 확장될 예정입니다.
영수증 유형과 패턴을 자동으로 분석하여 매장 정보, 결제 내역, 지불 방식 등 영수증에 기재된 정보를 추출합니다.
다양한 카드 형태를 인식하여 카드번호와 유효기간을 추출합니다.
사업자등록증 문서를 자동으로 분석하여 등록번호, 법인명, 대표자 등 사업자등록증에 기재된 정보를 추출합니다.
명함 내 정보를 추출하며, 한국어/일본어/영어 명함 인식을 지원합니다.
신분증 OCR은 주민등록증(구형, 신형), 운전면허증(구형, 신형), 여권(국내), 외국인등록증에 적힌 항목을 추출하여 정보를 제공합니다.
의료비 영수증의 진료 정보들을 추출합니다. 의료비영수증은 표 형태의 의료비영수증에서 진료과목, 질병군 번호, 영수증 번호, 납부 금액, 사업자등록번호 등 주요 정보를 추출합니다.
정보를 추출하고 싶은 영역을 템플릿으로 직접 지정하여, 동일한 유형의 문서 관리에 유용한 Template OCR 모델을 제공합니다.
특정 템플릿의 인식률 향상, CLOVA OCR 성능 개선 상담, 템플릿 작성에 도움이 필요한 경우 기술지원으로 문의해 주세요.
Document OCR 특화 모델은 계속적으로 추가될 예정입니다. 사용하시는 특화 모델에 따라 제공하는 Feature가 각기 다릅니다. 특화 모델에서 제공하는 대한 상세한 내용은 [CLOVA 특화모델 API 참조서]를 참고해 주세요.
다양한 서비스에 응용되어 적용될 수 있습니다.
사용자에게 전달받은 다양한 전표들을 해당하는 템플릿에 맞게 분류하고, 분류된 문서 내 검출/인식된 정보들을 사내 시스템과 연계하여 활용이 가능합니다.
사용자에게 전달받은 다양한 청구 서류들을 수작업으로 분류하지 않고, 자동으로 분류하는 작업에 활용할 수 있습니다.
다양한 형태로 정형화된 폼 인식 등의 서비스로 활용이 가능합니다.
인식 모델 | 서비스 플랜 | 단위 | 이용 요금(월) | 비고 | |
---|---|---|---|---|---|
프리미엄 | General | 이용 횟수 | 글자 추출 | - | 무료 제공 횟수(글자): 100회 / 월 |
표 추출 | - | 무료 제공 횟수(표): 100회 / 월 |
(VAT 별도)
표 추출 이용 시 글자 추출이 동시에 호출되며 1건당 25원이 청구됩니다.
최대 100만 건까지 호출 가능하며, 대용량 사용을 원하시는 경우 고객지원으로 문의해 주시기 바랍니다.
인식 모델 | 서비스 플랜 | 플랜 월 이용 요금 | 포함 내역 | 포함 내역 외 추가 API 이용 |
---|---|---|---|---|
베이직 | Free | - | 최대 300건 | - |
Basic | - | 1,000건 제공 | - / 건 | |
Standard | - | 10,000건 제공 | - / 건 | |
Advanced | - | 30,000건 제공 | - / 건 | |
프리미엄 | Basic | - | 7,500건 제공 | - / 건 |
Advanced | - | 30,000건 제공 | - /건 |
(VAT 별도)
Template OCR의 1회 호출 기준은 빌더에서 설정한 템플릿의 인식 영역의 수(Max 50개)입니다. 이를 초과하는 경우 추가 과금됩니다. (예) Template의 Box 영역의 수가 130개인 경우, 3회 API 호출로 과금
CLOVA OCR 서비스는 서비스 배포 후 API Gateway를 통해 호출되며 API Gateway 사용량에 따라 별도 과금됩니다.
인식 모델 | 서비스 플랜 | 플랜 월 이용요금 | 포함내역 | 포함 내역 외 추가 API 이용 |
---|---|---|---|---|
영수증 | Basic | - | 300건 제공 | - / 건 |
Standard | - | 3,000건 제공 | - / 건 | |
Advanced | - | 15,000건 제공 | - / 건 | |
신용카드 | Basic | - | 300건 제공 | - / 건 |
Standard | - | 3,000건 제공 | - / 건 | |
Advanced | - | 15,000건 제공 | - / 건 | |
명함 | Basic | - | 300건 제공 | - / 건 |
Standard | - | 3,000건 제공 | - / 건 | |
Advanced | - | 15,000건 제공 | - / 건 | |
사업자등록증 | Basic | - | 300건 제공 | - / 건 |
Standard | - | 3,000건 제공 | - / 건 | |
Advanced | - | 15,000건 제공 | - / 건 | |
신분증 | Basic | - | 300건 제공 | - / 건 |
Standard | - | 3,000건 제공 | - / 건 | |
Advanced | - | 15,000건 제공 | - / 건 | |
의료비 영수증 | Basic | - | 300건 제공 | - / 건 |
Standard | - | 3,000건 제공 | - / 건 | |
Advanced | - | 15,000건 제공 | - / 건 |
(VAT 별도)
Document OCR은 개인정보/민감 정보가 포함되어 있을 수 있어 사전 신청/승인 절차 진행 후 제공합니다. 신청 방법 안내
CLOVA OCR 서비스를 대량으로 호출하기 위해 서비스 유량 변경이 필요한 경우, 고객 지원을 통해 문의 바랍니다.