최근 HMCompany의 DFS(Digital Forensic Service) 본부 소속 직원들은 한국정보보호학회 디지털 포렌식 연구회가 주최하고, 국가정보원이 후원하는 국제 디지털 포렌식 경연 대회 'Digital Forensics Challenge 2020'에서 '기술 공모'와 '챌린지' 부문에서 각각 1위, 2위를 차지하여 디지털 포렌식 전문성과 기술의 연구 및 개발 그리고 적용까지 이어가는 능력을 입증했다.
기술 공모에서 발표한 'Image classification for digital forensic triage'는 다양한 이미지 파일에서 필요한 이미지를 빠르고 정확하게 분류해 내는 기술이다.
HMCompany는 지난 9년 동안 200여 개 기업들과 다양한 내부감사 업무를 수행하면서 지금까지 1만여 대가 넘는 업무용 PC에 저장된 데이터 분석결과, 업무와 관련하여 중요한 메신저(카카오톡, 텔레그램 등) 대화 내역들을 임직원들이 스크린 캡처해 저장하고 있는 것을 확인했다.
스크린 캡처 된 메신저 파일에서 중요 단서를 찾아야 되는 경우 분석자가 많은 시간을 투자하여, 수십대 많게는 수백대의 PC에서 수작업으로 일일이 찾아내야 했는데, 이번 기술 공모에서 발표한 딥러닝 기술을 이용하면 이미지 파일을 자동 분류할 수 있어 분석시간을 단축할 수 있었다.
해당 연구에서는 구글에서 제공하는 기계학습 라이브러리인 Tensorflow와 Keras를 이용해 이미지(캡처 된 카카오톡 메신저 파일)를 학습시켜 모델을 구현했으며, 과적합 현상을 줄이는 기법을 적용하여 카카오톡이 아닌 타 메신저 대화 내용 캡처 사진들도 분류가 가능하게 했다.
구현 도구는 확보된 데이터 중 카카오톡 메신저 캡처 파일을 분류하여 저장하고, OCR 엔진을 사용해 메신저로 분류된 파일들 중 선별에 필요한 키워드를 입력하면 키워드가 포함된 파일만 추출하는 기능도 탑재했다.
추가로 MTCNN 얼굴인식 모듈을 이용해 조사 대상자의 PC에서 대상자의 얼굴이 포함된 사진 파일을 찾아야 되는 경우, 대상자 증명사진으로 PC에 저장되어 있는 여러 사진 파일을 비교해 대상자가 포함된 사진을 쉽게 분류할 수 있다.
한편, 해당 기술들은 향후 HMCompany의 내부감사 업무에 활용할 예정이며, 지난 9년간 쌓아온 노하우와 딥러닝 기술을 이용하여 내부감사에 이용할 수 있는 자체 개발 리뷰 플랫폼 하이에나(Hyena)를 곧 공개할 예정이다.
김정환 기자 hwani89@segye.com
[ⓒ 세계일보 & Segye.com, 무단전재 및 재배포 금지]