세계일보

검색

[디지털 트랜스포메이션이 만들 내일] (33) 인공지능 기반 비주얼 인식 서비스의 가능성

관련이슈 디지털 트랜스포메이션이 만들 내일

입력 : 2018-04-27 19:14:06 수정 : 2018-04-27 19:14:06

인쇄 메일 글씨 크기 선택 가장 작은 크기 글자 한 단계 작은 크기 글자 기본 크기 글자 한 단계 큰 크기 글자 가장 큰 크기 글자

 


비주얼 인식(Visual Recognition) 서비스는 최근 떠오른 미래 유망한 인공지능(AI) 기술입니다.

최근 모 포털사이트는 웹툰의 만우절 광고로 ‘프리덤 투 썸’(Freedom to Thumb·엄지에 자유를 주자)이라는 제목의 영상을 제작했습니다. 웹툰을 볼 때 페이지를 컨트롤하는 엄지 대신 홍채를 이용하거나 특정 표정을 짓는 내용의 영상인데요. 예를 들어 홍채를 위로 올리면 페이지 맨 위로 올라가고, 입맞춤을 하면 ‘좋아요’가 클릭 되는 기능을 선보인 것입니다. 해당 동작이 기능을 발휘하려면 기본적으로 비주얼 인식 서비스가 적용돼야 합니다. 만우절 광고인 만큼 위 서비스는 아직 출시되지는 않았으나 언젠가는 런칭(출시)이 될 수도 있을 것 같습니다.

이처럼 비주얼 인식 서비스는 다양한 산업과 소비자에게 많은 편의성과 가치를 제공하는데요, 지금부터 하나씩 알아보도록 하겠습니다.


◆모든 이미지와 비디오를 분석한다···아마존 레코그니션(Amazon Recognition)

공항이나 백화점 같은 사람이 많은 혼잡한 곳에서 얼굴 인식 시스템을 통해 범인을 찾아내는 장면을 영화에서 많이 봐왔을 것입니다.

아마존 레코그니션(Amazon Recognition)은 단순히 얼굴 일치율을 분석하는 선을 넘어 더욱 고도화된 기술을 선보이고 있습니다. 이미지 또는 비디오를 레코그니션 API(Application Programming Interface)에 제공하기만 하면 서비스를 통해 그 속의 인물과 물체 등을 탐지해줍니다. 아마존 레코그니션의 주요 기능으로는 물체와 얼굴 인식, 얼굴 분석, 사람 추적, 부적절한 콘텐츠의 탐지, 유명인사 인식, 이미지 내 텍스트 추출 등이 있습니다.

먼저 물체 인식 기능을 통해서는 심층 신경망 모델을 활용해 이미지 속 수많은 물체와 장면을 탐지하고 분류합니다. 그리고 사진들을 자동으로 구분·분류·태깅(tagging)해 관심 분야의 서비스로 연결해줍니다. 예를 들어 산과 바다, 도시 등의 사진을 올리는 이를 여행 관련 정보 서비스로 연결해주거나, 결혼과 관련된 이미지를 올렸다면 출산이나 집들이 등에 연관된 광고로 이어질 수 있습니다.

아마존 레코그니션은 이미지 내 얼굴 위치를 식별해 그 속성을 분석합니다. 이미지 내 사람이 남자인지 여자인지, 웃고 있는지 울고 있는지 등을 식별해 분석합니다. 뿐만 아니라 인식 후 각각의 특징에 대해 퍼센트 단위로 신뢰도까지 계산하는 만큼 상업용으로도 활용할 수 있습니다. 예를 들어 대형 마트의 매장에서 쇼핑 중인 이의 얼굴 분석을 통해 만족도를 예측해 볼 수도 있습니다.

비디오 분석도 되는 만큼 아마존 레코그니션을 통해 공공 안전과 보안에 즉각 대응할 수도 있습니다. 예를 들어 실종자 데이터베이스와 대조하여 얼굴을 인식함으로써 법 집행 기관에서는 일치하는 얼굴을 정확하게 표시할 수 있는 만큼 수사 속도를 높일 수 있습니다.


◆‘왓슨 비주얼 인식’ 서비스의 새로운 시도

‘왓슨 비주얼 인식’(Watson Visual Recognition)은 이미지의 내용을 이해하는 서비스입니다. IBM의 AI 왓슨을 활용해 장면과 사물, 얼굴, 색상, 음식, 기타 이미지를 분석하여 시각적 콘텐츠에 대한 인사이트를 제공합니다. 예를 들어 나이와 성별을 추측하고, 또는 비슷한 이미지들을 찾을 수도 있습니다. 또한 수요자에게 필요한 분석을 위해 커스텀(custom)한 콘셉트(Concept)를 생성하여 서비스를 훈련할 수 있습니다. 리테일(Retail·소매) 분야에서 재고를 관리할 때 유용하게 쓰이고, 인벤토리(물품 목록)에서 과일 종류나 손상된 과일을 식별하는데 비주얼 인식을 활용할 수 있습니다.
 
그럼 아래의 옷 매장 이미지와 관련해 왓슨 비주얼 인식 서비스에 적용하여 어떤 결과값을 보여주는지 확인해보겠습니다.


결과값을 보면 항목별로 일치하는 점수가 나와 있으며, 높은 확률로 각각의 특성을 구분해 놓은 것을 확인할 수 있습니다.
 
이러한 기본적인 분석 서비스를 바탕으로 왓슨 비주얼 인식은 새로운 산업 영역에 발을 들였습니다. 그 중 하나가 모조품 혹은 분실 신고된 다이아몬드를 알아내는 것입니다. 사전에 다이아몬드의 진품 인증서와 일련번호, 색, 투명도, 컷(광채를 강화하는 보석의 가공법), 캐럿(무게), 크리 모양과 같은 세부사항에 대한 정보를 학습시킨 뒤 사진과 등록된 데이터를 바탕으로 분석을 진행함으로써 분실 신고가 된 것인지 혹은 모조품인지 확인할 수 있습니다.

뿐만 아니라 AI 우주비행사 ‘싸이먼’(CIMON·Crew Interactive Mobile Companion)은 왓슨 비주얼 인식 서비스 API를 활용해 여러 개의 우주 실험실로 이뤄진 ‘콜럼버스’ 모듈의 건설 계획과 실험실에서 이뤄질 각종 모든 절차를 학습했습니다. 이러한 학습 덕에 CIMON은 독일인 우주비행사 알렉산더 거스트를 보조해줄 수 있을 뿐만 아니라 기술적인 문제가 발생하기 전에 조기 경보와 문제에 대한 해결책을 제시할 수 있습니다.

◆많은 사업분야에서 활용되는 ‘에이브릴’(AIBRIL) 이미지 인식 서비스

SK㈜ C&C의 AI인 ‘에이브릴’(AIBRIL)의 이미지 인식 서비스는 딥러닝(심화학습) 기반 알고리즘을 이용해 디지털 이미지를 분석하고 내재한 의미를 파악합니다. 이미지에 유의미한 태그를 지정하고 자동차와 얼굴, 음식 등 오브젝트(사물)를 식별할 수 있으며 유사 이미지를 분류해낼 수 있습니다. SK㈜ C&C는 한국암웨이와도 손잡고 AI 로봇 서비스인 ‘드리미’에도 이미지 인식 서비스를 적용했습니다. 더 나아가 해당 서비스는 다양한 응용 프로그램과 산업분야에서 사용될 수 있습니다.


또한 에이브릴 이미지 인식 서비스는 사물의 인식률을 높이는 훈련도 할 수 있습니다. 그 방법 중 하나인 포지티브, 네거티브 이미지 세트를 지정합니다. 포지티브 이미지 세트는 식별해내고자 하는 결과물을 보여줄 것이며, 네거티브 이미지 세트는 반대로 식별하지 못하도록 훈련하는 것입니다. 그 외에도 다양한 훈련 방법이 있으며, 이렇게 함으로써 신뢰도 점수(인식률)를 높이고 사용자에게 가치를 제공합니다.

SK㈜ C&C PR팀

*지난주 기고는 출고되지 않은 점 미리 알려드리지 못한 점 독자 여러분께 죄송합니다. 앞으로 기고는 2주에 한번씩 출고될 예정입니다.


[ⓒ 세계일보 & Segye.com, 무단전재 및 재배포 금지]

오피니언

포토

레드벨벳 슬기 '물오른 미모'
  • 레드벨벳 슬기 '물오른 미모'
  • 서현진 '매력적인 미소'
  • 아이린 '우아한 윙크'
  • 조여정, 순백 드레스 자태…과감한 어깨라인