세계일보

검색

MS도 구글도 도입한 ‘베이즈 통계’의 모든 것

입력 : 2017-03-25 03:00:00 수정 : 2017-03-24 19:37:01

인쇄 메일 글씨 크기 선택 가장 작은 크기 글자 한 단계 작은 크기 글자 기본 크기 글자 한 단계 큰 크기 글자 가장 큰 크기 글자

고지마 히로유키 지음/장은정 옮김/지상사/1만5500원
세상에서 가장 쉬운 베이즈통계학 입문/고지마 히로유키 지음/장은정 옮김/지상사/1만5500원


빅데이터가 더욱 활용되는 시대에 맞는 책이다. 현대 통계의 주류인 ‘베이즈 통계’의 개념을 풀이했다. 베이즈 통계는 인터넷의 보급과 맞물려 대규모 비즈니스에 활용되고 있다. 인터넷에서 고객의 구매 행동이나 검색 행동 이력이 자동으로 수집되는데, 그로부터 고객의 ‘타입’을 추정하기에 적합하다. 이는 전통적인 통계학보다 베이즈 통계를 활용하는 편이 훨씬 편리하기 때문이다.

현재 많은 정보통신 계열 기업이 실제로 베이즈 통계를 이용하고 있다. 미국의 마이크로소프트는 일찍부터 베이즈 통계를 비즈니스에 이용한 것으로 유명하다. 윈도우즈 OS의 도움말 기능에도 베이즈 통계가 도입되었다. 가령 웹상에서 사용자가 ‘아이의 병 증상’을 검색했을 때 유용한 지침이 우선적으로 노출되는 소프트웨어 등이 베이즈 통계로 개발되었다.

마이크로소프트의 창업자 빌 게이츠는 1996년 신문을 통해 자사가 경쟁상 우위에 있는 이유가 베이즈 통계로 인한 것임을 공표했다. 구글도 자사 검색엔진의 자동번역 시스템에 베이즈 통계의 기술을 활용한 것으로 널리 알려져 있다.

이밖에도 베이즈 통계의 기술은 IT 기업 등 다양한 분야에 응용되고 있다. 예컨대 팩시밀리의 경우 전송된 이미지의 노이즈(잡음)를 수정하여 원 이미지에 가깝게 만드는 데 베이즈 통계를 사용하고 있다. 의료분야에서도 ‘자동진단시스템’ 등에 베이즈 통계를 활용하고 있다.

베이즈 통계의 강점은 ‘데이터가 적어도 추측할 수 있으며, 데이터가 많을수록 정확해진다’는 성질을 이해한다는 데 있다. ‘들어오는 정보에 실시간으로 반응하여 자동적으로 추측을 업데이트한다’는 학습 기능도 있다. 이 책을 읽으면 누구나 베이즈 통계가 첨단 비즈니스에 최적임을 수긍할 것이며, 실제 비즈니스에 활용도가 높다는 사실을 실감할 수 있다.

정승욱 선임기자 jswook@segye.com

[ⓒ 세계일보 & Segye.com, 무단전재 및 재배포 금지]

오피니언

포토

비웨이브 아인 '미소 천사'
  • 비웨이브 아인 '미소 천사'
  • 비웨이브 제나 '깜찍하게'
  • 정은지 '해맑은 미소'
  • 에스파 카리나 '여신 미모'