CLOVA OCR은 전세계적으로 가장 권위 있는 글로벌 챌린지인 ICDAR 2019 4개 분야에서 1위, CVPR 및 ICCV 국제 학회 논문으로 선정되는 등 독보적인 기술력을 자랑합니다. 특히 읽는 순서와 방향을 추정해 이미지 속 문자를 인식하며, 곡선으로 배열되거나 기울어진 문자, 필기체까지 인식할 수 있어 더욱 정확하게 데이터를 추출할 수 있습니다.
CLOVA OCR은 네이버의 AI 기술을 사용하여 주요 비즈니스 활용에 최적화된 고성능 OCR 인식 모델을 적용하였습니다. 문자 인식은 한국어, 영어, 일본어를 지원하며 필기체 인식은 한국어와 일본어를 지원합니다.
특정 양식을 지닌 문서에서 문자 추출 시 해당 양식에 적합한 템플릿을 제작하고 지정한 영역에서 필요한 문자만 빠르게 추출할 수 있습니다. 내부 전용 서식을 디지털 데이터로 변환하는 데 유용하게 활용할 수 있습니다.
인식한 문서와 생성한 템플릿 간 유사도를 측정하고 문서를 자동으로 분류하여 수작업을 간소화할 수 있습니다. 또한 외부 검증 기능을 연동해 검증 작업을 줄이고 신뢰도를 높일 수 있으며, Papago 등 다른 서비스와 연계하여 차별화된 서비스를 제공할 수 있습니다.
단순한 문자 인식을 넘어 문서 유형을 분류하고 구조화된 형태로 문자를 추출합니다.
고객이 이미지 데이터(사진)를 RESTful API 방식으로 전달하면, 해당 이미지를 분석하여 텍스트 추출 결과를 JSON 형태로 제공합니다.
항목 | 내용 |
---|---|
이미지 내의 Text 탐지 | 이미지 파일 형식은 현재 JPG, PNG, PDF, TIFF 형식을 지원하며, 지원 포맷은 계속 확대될 예정입니다. |
인식 템플릿 | 서식 문서 에서 인식을 원하는 영역을 설정 하면, 구조화된 값으로 추출하여 정형화된 인식 결과를 전송합니다. OCR 빌더에서 다양한 인식 템플릿을 설정하고, 서비스에 배포가 가능합니다. |
인식값 검증 | 검증이 필요한 이미지의 판독 값에 대해서 외부 검증 서버와 연동될 수 있도록 검증 연동 End-point를 제공합니다. |
멀티 박스 | 여러 개의 글자 입력 박스들을 조합하여 인식하는 멀티 박스(예: 우편번호) 기능을 제공합니다. |
체크 박스 | 체크 표시를 인식할 수 있는 체크 박스 기능을 제공합니다. |
도메인 복사 | 도메인을 설정값을 복사하여 기존 템플릿을 그대로 유지한 새로운 도메인 생성 및 플랜 변경이 가능합니다. |
※ 이미지 파일 사이즈는 사용 가이드를 참고해주세요.
인식 모델 | 베이직 | 프리미엄 | 설명 |
---|---|---|---|
모델 인식률 | 활자체 및 필기체 인식 | 활자체 및 필기체 인식 | 주요 비즈니스 활용에 최적화된 고성능 OCR 인식 모델을 제공 |
적합 문서 | 증명서, 고정 폼 양식 | 수기 신청서 가입 양식, 금융 문서 등 | |
인식 템플릿 레이아웃 | 제공 | 제공 | 인식 영역을 설정 |
멀티박스 | 제공 안함 | 제공 | 싱글 박스 템플릿을 조합하여 번호 인식영역 등을 제어 |
체크박스 | 제공 안함 | 제공 | 체크 박스 형태의 인식 제공 |
필드 유형 | 제공 안함 | 제공 | 인식 값을 숫자로만 인식되도록 유형을 설정 |
많은 학습데이터를 기반으로 CLOVA AI 기술을 적용하여 문서의 주요 Feature를 추출합니다.신용카드/명함/신분증이 제공되며, 계속적으로 Document OCR 모델이 확장될 예정입니다.
다양한 카드 형태를 인식하여 카드번호와 유효기간을 추출합니다.
명함 내 정보를 추출하며, 한국어/일본어/영어 명함 인식을 지원합니다.
신분증 OCR은 다양한 형태의 신분증 - 주민등록증(구형,신형)/운전면허증(구형,신형)/여권(국내) 항목들을 추출하여 정보를 제공합니다.
정보를 추출하고 싶은 영역을 템플릿으로 직접 지정하여, 동일한 유형의 문서 관리에 유용한 Template OCR 모델을 제공합니다.
특정 템플릿의 인식률 향상, CLOVA OCR 성능 개선 상담, 템플릿 작성에 도움이 필요한 경우 기술지원으로 문의해 주세요.
Document OCR 특화 모델은 계속적으로 추가될 예정입니다. 사용하시는 특화 모델에 따라 제공하는 Feature가 각기 다릅니다. 특화 모델에서 제공하는 대한 상세한 내용은 [CLOVA 특화모델 API 참조서]를 참고해 주세요.
다양한 서비스에 응용되어 적용될 수 있습니다.
사용자에게 전달받은 다양한 전표들을 해당하는 템플릿에 맞게 분류하고, 분류된 문서 내 검출/인식된 정보들을 사내 시스템과 연계하여 활용이 가능합니다.
사용자에게 전달받은 다양한 청구 서류들을 수작업으로 분류하지 않고, 자동으로 분류하는 작업에 활용할 수 있습니다.
다양한 형태로 정형화된 폼 인식 등의 서비스로 활용이 가능합니다.
인식 모델 | 서비스 플랜 | 단위 | 이용 요금(월) | 비고 | |
---|---|---|---|---|---|
프리미엄 | General | 이용 횟수 | 글자 추출 | - | 무료 제공 횟수(글자): 100회 / 월 |
표 추출 | - | 무료 제공 횟수(표): 100회 / 월 |
(VAT 별도)
표 추출 이용 시 글자 추출이 동시에 호출되며 1건당 25원이 청구됩니다.
최대 100만 건까지 호출 가능하며, 대용량 사용을 원하시는 경우 고객지원으로 문의해 주시기 바랍니다.
인식 모델 | 서비스 플랜 | 플랜 월 이용 요금 | 포함 내역 | 포함 내역 외 추가 API 이용 |
---|---|---|---|---|
베이직 | Free | - | 최대 300건 | - |
Basic | - | 1,000건 제공 | - / 건 | |
Standard | - | 10,000건 제공 | - / 건 | |
Advanced | - | 30,000건 제공 | - / 건 | |
프리미엄 | Basic | - | 7,500건 제공 | - / 건 |
Advanced | - | 30,000건 제공 | - /건 |
(VAT 별도)
Template OCR의 1회 호출 기준은 빌더에서 설정한 템플릿의 인식 영역의 수(Max 50개)입니다. 이를 초과하는 경우 추가 과금됩니다. (예) Template의 Box 영역의 수가 130개인 경우, 3회 API 호출로 과금
CLOVA OCR 서비스는 서비스 배포 후 API Gateway를 통해 호출되며 API Gateway 사용량에 따라 별도 과금됩니다.
인식 모델 | 서비스 플랜 | 플랜 월 이용요금 | 포함내역 | 포함 내역 외 추가 API 이용 |
---|---|---|---|---|
신용카드 | Basic | - | 300건 제공 | - / 건 |
Standard | - | 3,000건 제공 | - / 건 | |
Advanced | - | 15,000건 제공 | - / 건 | |
명함 | Basic | - | 300건 제공 | - / 건 |
Standard | - | 3,000건 제공 | - / 건 | |
Advanced | - | 15,000건 제공 | - / 건 | |
신분증 | Basic | - | 300건 제공 | - / 건 |
Standard | - | 3,000건 제공 | - / 건 | |
Advanced | - | 15,000건 제공 | - / 건 |
(VAT 별도)
Document OCR은 개인정보/민감 정보가 포함되어 있을 수 있어 사전 신청/승인 절차 진행 후 제공합니다. 신청 방법 안내
CLOVA OCR 서비스를 대량으로(General OCR 월 100만 건 이상, Template OCR 월 5만 건 이상) 호출을 원하시는 경우 고객지원으로 문의해주세요.
(예시)
수집된 문서의 디지털화를 위해 대용량(월 100만 건 이상) 으로 사용을 원하시는 경우
CLOVA OCR 인식 템플릿의 개선된 사용(고객 전용의 Template지원 등)을 원하시는 경우
CLOVA OCR 서비스를 고객님의 서비스에 최적화 적용하기 위한 컨설팅 등을 원하는 경우