유니티가 제조, 소매 및 보안 업계의 컴퓨터 비전 애플리케이션 개발 비용을 줄이고 인공지능(AI) 학습 시간을 단축할 수 있는 ‘유니티 컴퓨터 비전 데이터 세트’를 출시한다고 밝혔다.
AI 학습을 위한 데이터 세트의 활용에서 중요한 이슈 가운데에는 개인정보 보호와 규정 표준의 준수가 있다. 합성 데이터는 실제 데이터를 활용할 때 직면하는 개인정보 보호 등의 제약을 해소할 수 있다는 장점 때문에 다양한 경우에 유용하게 쓰일 수 있다. 특히 합성 데이터는 데이터가 없거나 데이터를 얻을 수 없는 미출시 제품의 테스트에 많이 사용된다. 합성 훈련 데이터는 머신러닝 알고리즘에 반드시 필요한 요소이지만, 자율주행 차량과 같은 실제 사례에서는 확보하는 데 비용이 많이 드는 데이터이기도 하다.

유니티 컴퓨터 비전 데이터 세트는 이러한 비용 부담을 줄이고, AI와 머신러닝 훈련을 가속화할 수 있는 고품질 합성 데이터를 더 쉽게 확보하는 것이 핵심이다. 유니티의 컴퓨터 비전 데이터 세트는 ‘도메인 무작위화’ 기법을 활용해 애플리케이션의 품질을 개선하고 편향을 제어하는 다양한 데이터 세트를 생성한다. 이 프로세스를 통해 대상 오브젝트의 위치와 방향, 조명과 카메라 각도를 비롯해 조합 가능한 많은 수의 설정 순열을 유니티 환경으로 출력할 수 있다. 또한 유니티의 합성 데이터 세트를 사용하면, 직접 촬영하거나 인터넷에서 가져온 실제 인물 및 장소 이미지를 포함하는 과정에서 발생할 수 있는 개인정보 침해와 방지가 어려운 편향 문제도 피할 수 있다.
실제 공간 데이터에서는 주석 유형이 복잡할 경우 주석화에 드는 비용이 증가하지만, 유니티는 어떤 레이블 유형이든 한 가지의 비용으로 제공한다. 따라서 2D 및 3D 바운딩 박스, 클래스 세분화, 인스턴스 세분화 등 복잡하거나 간단한 여러 업계 표준 레이블 유형을 동일한 가격으로 이용할 수 있다. 데이터 세트 구매는 합성 이미지 수요에 비례하여 이미지당 가격이 낮아지는 계층형 가격 책정 모델로도 가능하다.

유니티의 대니 랭(Danny Lange) 인공지능 및 머신러닝 부사장은 “검증된 개인정보 보호 규칙을 반영해 그대로 실제 데이터에 적용하는 합성 데이터 세트를 만들 수 있다는 것은, 혁신을 시도하는 수많은 기업에 획기적인 데이터 세트를 제공할 수 있다는 것을 뜻한다”면서, “합성 데이터는 실제 공간의 데이터를 직접 수집하고 레이블을 지정해야 하는 단점을 극복한다는 점에서 머신러닝 모델 학습 분야의 혁명이라고 할 수 있다. 유니티는 업계에 상관없이 가능성을 탐색하고, 크리에이터가 올바른 결정을 내리는 데 필요한 데이터를 합리적인 가격으로 사용할 수 있도록 지원할 예정”이라고 전했다.
댓글 남기기