한국도 ‘족집게 예측’시대 와야 미국 대통령 선거 결과를 100% 맞힌 사람이 있다. 뉴욕 타임스는 그에게 공식 블로그를 제공했다. 블로그의 이름은 538인데 이는 대통령 선거인단의 숫자다. 이 블로그의 주인공은 네이트 실버라는 34세의 젊은 인물로 오바마가 당선된 이번 선거에서 미국의 50개 주와 워싱턴 DC의 우승자를 모두 맞혔다.
한상근 KAIST 교수·수리과학 |
실버를 엉터리라고 비난하던 사람이 있었지만 선거가 끝난 뒤에도 사과한 사람은 없었다. 그런 그가 야구에서 선거예측으로 방향을 바꾼 이유는 대다수 선거예측의 품질이 좋지 않았기 때문이었다. 선거예측에서 그가 한 것은 책 제목이 명확하게 보여주듯 ‘신호와 잡음’을 따로 걸러내는 일이었다.
실버는 여론조사의 설계방법 자체에 의구심을 가지고 있었다. 그것을 이해하려면 확률을 두 가지 관점으로 봐야 한다. 하나는 우리가 평소 이해하는 대로 동전을 던지면 앞면이 나올 확률이 50%라고 하는 것으로 여기에는 근본적인 문제점이 숨어있다. 예컨대 1만번을 던지면 앞면이 나올 확률이 5000번에 가까운 숫자가 나오겠지만 정확히 5000번 나오는 일은 극히 드물다. 5010번 나왔으니 확률이 원래 50.1%라는 사람에게 당신이 틀렸다고 어떻게 말할 수 있겠는가. 50이라는 숫자는 사람의 믿음인 것이다. 현대수학의 확률론에서는 처음부터 확률이 정해져 있다고 가정하고서 시작하지 알지 못하는 확률을 찾아내는 방법을 거의 다루지 않는다.
다른 하나의 관점은 50이라는 숫자가 진실일 확률, 즉 확률의 확률을 말하는 것으로 정보를 얻을 때마다 기존 예상을 수정 보완하는 방식인데 이를 베이지안(Bayesian) 확률이라고 부른다. 어린아이가 지식을 습득하는 방식이 베이지안이어서 성인보다 빠르다는 심리학자들이 있는데 지금도 볼 수 있는 실버의 538블로그에는 90.9%의 확률로 오바마가 승리한다고 나와 있다.
혹자는 미국은 주마다 승자가 선거인단을 모두 가져가는 간접선거 방식이니까 예측하기 쉬웠다고 말한다. 실버는 선거인단뿐만 아니라 오바마가 전체 투표의 50.8%를 얻을 것이라고 득표율까지 예측했는데 실제로는 51%를 얻었다. 여러 가지 이유가 있겠지만 실버가 발견한 것은 온라인응답의 신뢰성이 가장 높고 다음으로 휴대전화, 그리고 신뢰성이 가장 낮은 것이 집 전화라는 것이다. 그런데 한국의 여론조사는 집 전화의 응답비중이 휴대전화보다 네 배 정도 높다. 우리나라에서는 12월 2일 세 곳에서 동시에 여론조사를 했는데 그 결과는 서로 다르게 나타났다. 어느 조사기관에서는 1% 미만의 차이가 났고 또 다른 곳에서는 8% 이상의 차이가 났다. 이제는 한국에서도 ‘실버’가 나와야 하지 않을까.
한상근 KAIST 교수·수리과학
[ⓒ 세계일보 & Segye.com, 무단전재 및 재배포 금지]