▲ 구재남 조사관리팀장 동남지방통계청 진주사무소

작년 말 미국에서는 44대 오바마 대통령의 임기가 끝나 선거를 통해 45대 대통령으로 도널드 트럼프가 당선되었다. 당시 대다수의 여론조사기관은 힐러리의 승리를 예상했었으나, 결과가 전혀 다르게 나타나 전 세계가 놀라고 ‘샤이 트럼프(Shy Trump)’라는 신조어가 만들어지기도 했다.

올해 우리나라는 대통령 탄핵으로 4월 12일 일부지역의 보궐선거를 필두로 5월 9일 장미대선이 기다리고 있다. 이처럼 선거를 앞두고 언론에서 자주 접하게 되는 것이 각 후보들의 지지도에 대한 여론조사 결과일 것이다.

여론조사는 기본적으로 조사주체, 조사기간, 조사대상, 조사방법, 그리고 그 조사에 대한 신뢰수준을 명시해야 조사결과에 대한 신뢰성을 확보할 수 있다.

만약 어떤 여론조사 결과에서 박보검, 송중기 두 후보의 지지율이 각각 30%, 28%로 95% 신뢰수준에서 표본오차 ±3%p라고 되어 있다면 그 의미는 무엇일까?

표본오차는 조사의 대상이 되는 모집단과 조사를 위해 추출되는 표본의 크기가 서로 상이하기 때문에 나타나는 오차이다. 예를 들어 전 국민을 대상으로 후보의 지지도를 조사하고자 할 때 모집단은 우리나라 전체 국민이 되는데, 이를 모두 조사하는 것은 현실적으로 불가능하기 때문에 전체 국민을 지역별, 성별, 연령별 비율분포에 맞추어 일정한 수의 조사 표본을 구성하게 된다.

그렇다면 표본조사를 통해 얼마나 신뢰할 수 있는 정도가 중요한데, 여기서 모집단 전체를 조사 했을 때의 의견과 표본조사를 통해 얻어진 의견과의 차이가 곧 표본오차라고 생각하면 큰 무리는 없을 것이다.

신뢰수준이란 표본에 의한 조사결과의 확실성 정도를 표현한 것으로 같은 조사를 여러번 했을 때 오차범위 내 동일한 결과가 얼마나 나오는가 하는 것이다. 예를 들어 95% 신뢰수준이라고 하면, 동일한 조건 내에서 같은 조사를 100번 반복하면 오차범위내 동일한 결과가 나올 횟수가 95번이라는 의미이다. 따라서 이 두 후보의 지지율은 박보검 27~33%, 송중기 25%~31%로 27~31% 구간에서 겹치므로 언제든지 순위가 뒤바뀔 수 있는데, 이를 오차범위 내 접전이라고 한다. 따라서 언뜻 보기에는 박보검이 송중기보다 2%P 높아 보이지만, 송중기가 박보검을 앞설 수도 있기 때문에 예측이 어렵다.

미국의 여론조사가 결과를 제대로 예측하지 못해서인지, 최근 여론조사에 대한 논란이 많은 것은 사실이며, 여론조사의 방법이 문제가 되어 예측 결과가 맞거나 틀릴 수도 있다. 또 표본을 조사하다 보면 응답률이나 표본추출의 문제로 표본이 전체를 잘 대표하지 못해 편향된 결과가 나오거나, 미국 대선에서처럼 응답자가 의도적으로 허위 답변을 하는 문제도 발생 할 수도 있다.

하지만 이보다 더 큰 문제는 여론조사를 조작하거나 악용하려는 사람들이 항상 존재한다는 것이다. 여론조사는 엄연히 과학이 될 수 있다. 그럼에도 불구하고 여전히 많은 기관에서 각종 여론조사를 실시해 결과를 발표하지만, 표본추출 과정과 조사내용 등 기본적인 조사 방법조차 밝히지 않는 곳도 있다. 이런 조사결과는 의심해 볼 필요가 있으며 앞으로는 여론조사 결과를 보게 되면 조사주체, 조사대상, 조사방법, 조사결과에 대한 표본오차와 신뢰수준 등에도 관심을 가져보는 것도 좋을 듯하다.

저작권자 © 뉴스사천 무단전재 및 재배포 금지