아마존웹서비스(Amazon Web Services)는 스캔 문서에서 텍스트와 데이터를 자동으로 추출하는 기계 학습 서비스인 ‘Amazon Textract’의 업데이트를 발표했다.
AWS re:Invent 2018에서 공개된 Amazon Textract는 스캔한 문서에서 텍스트, 수기 기록, 데이터를 자동으로 추출하는 기계 학습 서비스로써, 단순한 광학 문자 인식(OCR)을 넘어 양식과 표에서 데이터를 식별하고 추출할 수 있다. 영어, 스페인어, 독일어, 이탈리아어, 포르투갈어, 프랑스어로 인쇄된 텍스트를 지원한다.

AWS re:Invent 2018에서 처음 공개된 Amazon Textract는 최근에는 청구서 및 영수증 처리에 대한 전문 지원을 도입했고 수기로 기록한 텍스트, 양식 및 표를 추출하는 기본 컴퓨터 비전 모델을 향상시켰다. Amazon Textract를 사용하면 청구서 및 세금 양식 처리나 대출 신청 등 중요한 업무 프로세스 워크플로를 자동화할 수 있다. 사람이 검토하는 시간은 줄이고 정확도는 높이면서, 비용 절감 및 혁신을 가속화하는 효과를 얻을 수 있다는 것이 AWS의 설명이다.
한편, AWS는 Textract의 비동기식 작업 처리 시간을 줄이는 업데이트를 소개했다. AWS에 따르면 대부분의 고객이 문서 파이프라인을 대규모로 처리할 때 Textract를 비동기식으로 호출하고 있는데, Textract의 비동기식 API 작업을 향상하여 전체적인 지연을 최대 50%까지 단축할 수 있게 되었다.
또한, 9월부터는 서울을 포함한 8개 리전에서 Amazon Textract의 요금이 인하된다. 서울 리전의 경우 매월 첫 100만 페이지를 처리할 때 1000페이지당 유효 요금이 19% 낮아졌다는 것이 AWS의 설명이다.
댓글 남기기