메뉴 건너뛰기

close

구글 트렌드는 검색 기간과 지역, 검색 키워드 개수 등 기준에 따라 결과가 달라져 세심한 해석이 필요하다. 위 사진은 4일 오전 해당 서비스에서 '문재인,안철수,홍준표'를 주제어로 넣자 나타난 결과(지역:전세계, 기간:2017년 4월 4일~5월 4일).
 구글 트렌드는 검색 기간과 지역, 검색 키워드 개수 등 기준에 따라 결과가 달라져 세심한 해석이 필요하다. 위 사진은 4일 오전 해당 서비스에서 '문재인,안철수,홍준표'를 주제어로 넣자 나타난 결과(지역:전세계, 기간:2017년 4월 4일~5월 4일).
ⓒ 구글트렌드 화면캡쳐

관련사진보기


"빅데이터 지수가 안철수 후보의 승리를 예고하고 있다. 지난 미국 대선 당시 도널드 트럼프는 일반 여론조사에서 힐러리 클린턴에 패배하는 것으로 나왔지만 실제 선거 결과는 트럼프의 압승이었다. 구글트렌드 등 빅데이터 분석만이 트럼프의 승리를 정확히 예측했다. 지금 우리나라의 대선과 관련한 빅데이터 결과를 보면 안철수 후보가 승리하는 것으로 나온다."
-4월 30일 안철수 측 김철근 선대위 대변인, '안철수 후보는 승리 할 것이다' 논평에서

"중요한 것은 우리가 미래인터넷지표인 트렌드 검색량이 얼마나 되는가, 미국에서도 지금 트럼프-힐러리 때 여론 조사는 힐러리가 앞섰지만 트렌드 검색에서는 트럼프가 월등히 앞섰는데 그대로 선거 결과가 나왔다는 것 아니겠나. 그래서 저희도 그런 저런 지표들을 보고 있고…(중략) 또 빅데이터 종합한 나름의 결과, 여의도연구소 여론조사의 트렌드, 이런 걸 볼 때…. 이제 발표가 되지 않는 기간 중에 우리가 쪽 올라가서 피크를 5월 9일 찍겠다."
-5월 1일, 안철수 측 김경진 선대위 홍보본부장, '김어준의 뉴스공장' TBS라디오에서

"김경진 홍보본부장은 구글 등에서 빅데이터로 측정한 트렌드 검색량은 안 후보가 문 후보를 앞선다고 주장했다. 김영환 미디어본부장은 '안철수 후보 표가 15%는 묻혀 있다'고 주장했다. 하지만 팩트체크 결과 그 주장은 거짓이다. 문재인 후보가 1위이고, 안철수 후보가 앞섰던 것은 지난 4월 4일에서 18일경 부정검색 때문이다. (중략) 구글 트렌드 검색량을 팩트체크한 결과 안철수 후보 측의 주장은 거짓이다."
-5월 2일, 문재인 측 윤관석 선대위 공보단장, '안 후보 관련 팩트체크 브리핑' 논평에서

대선이 5일 앞으로 다가온 가운데, 문재인(더불어민주당)-안철수(국민의당) 대선 후보 측이 구글트렌드 등 빅데이터 조사를 놓고  공방을 벌이고 있다. 민주당 측은 국민의당 측 주장이 "거짓"이라고 규정지었고, 국민의당 측은 논평을 통해 "진짜"라고 재반박했다.

국민의당은 여론조사에서 드러난 안 후보의 열세를 '빅데이터 지수'로 만회할 수 있다는 심산이다.

도대체 누구 말이 맞을까. 결과적으로 말하면 판단할 수 없다. 양측이 모두 같은 구글트렌드 검색량을 근거로 논평했지만, 해당 논평의 근거에 있어 검색 시기·지역 등 서로 다른 잣대를 통해 나온 결과로 공방을 벌였기 때문이다. 종합하면, 양측이 서로 다른 결과물을 가지고 각기 '아전인수'식 해석을 내놓은 셈이다.

애초 "빅데이터로는 안철수 후보가 이긴다"라고 먼저 주장한 건 안철수 후보 측이었다(4월 30일, 김철근 대변인). 그러나 해당 논평에서 승리와 관련한 근거는 제시되지 않았다. 안 후보 측은 당시 "빅데이터 지수가 안 후보의 승리를 예고하고 있다"면서도 자세한 근거는 없이 "지금 대선과 관련한 빅데이터 결과를 보면 안철수 후보가 승리하는 것으로 나온다"라고만 썼다(해당 논평 보기).

그러나 국민의당 측에 논평으로 반박한 민주당도 사실관계가 정확하다고 하기는 어렵다. 문 후보 측은 지난 2일 윤관석 공보단장을 통해 "팩트체크 결과 안 후보 측 주장은 거짓"이라고 논평했지만 그 근거는 자의적이었다. 안 후보 측이 애초 구글트렌드와 관련한 검색 기간.지역 등을 언급하지 않았음에도, 이를 특정 기간(4.4~4.18일)으로 추정해 검색한 뒤 "상대 주장은 거짓"이라고 단정했기 때문이다(해당 논평 보기).

양측이 근거로 삼은 '구글트렌드 서비스(https://trends.google.com)'는 구글 사이트에서 사람들이 검색한 특정 키워드 추세를 수치로 보여주는 것으로, 해당 주제에 대한 대중적 관심도를 보여준다. 특히 키워드에 대한 검색 기준이 지역(나라별)·기간별·카테고리 등으로 각각 나뉘어 있어, 이를 어떻게 설정하느냐에 따라 결과 값은 다르게 나타난다. 구글 측은 관련해 "수치는 특정 지역·기간 차트에서 검색 관심도·인기도를 나타낸다"라고 설명하고 있다.

문 후보 측이 자의적 기준을 근거로 "안 후보 측 주장은 거짓"이라고 논평하자, 안 후보 측도 논평을 통해 재반박을 이어갔다. 그러나 이 또한 상대의 논평 근거와는 다른 기준(기간)을 적용했다. 안 후보 측 김철근 대변인은 상대 측 근거가 "일시적 착시현상"이라며 "판세분석은 하루가 아니라 한 달 간 유권자 움직임을 분석한 것"이라고 반박했다. 다음은 김 대변인의 논평 중 일부다(논평 전문 보기).

"민주당이 빅데이터를 활용한 국민의당 판세분석 결과를 가짜뉴스라고 규정지었다. 근거로는 지난 달 30일 단 하루 구글 검색량을 제시했다. 이는 일시적 착시현상이다. 국민의당 판세분석은 단 하루가 아니라 한 달 동안 유권자의 움직임을 분석한 것이다. 구글 트렌드를 한 달 평균으로 계산하면 안철수 후보 54, 문재인 후보 53, 홍준표 후보 29로 집계된다. (중략) 반면 문재인 후보의 구글 트렌드는 급락세로 돌아섰다."
-5월 2일 안철수 측 김철근 선대위 대변인, '빅데이터 이것이 진짜뉴스다' 논평에서

안철수(국민의당,사진 위)-문재인(더불어민주당,사진 아래) 대선 후보 측이 구글트렌드 등 빅데이터 조사를 놓고 진실 공방을 벌였으나, 확인 결과 서로 다른 잣대로 '아전인수'식 해석을 내놓은 것으로 보인다. 사진은 양측 논평 화면 갈무리
 안철수(국민의당,사진 위)-문재인(더불어민주당,사진 아래) 대선 후보 측이 구글트렌드 등 빅데이터 조사를 놓고 진실 공방을 벌였으나, 확인 결과 서로 다른 잣대로 '아전인수'식 해석을 내놓은 것으로 보인다. 사진은 양측 논평 화면 갈무리
ⓒ 국민의당,더불어민주당

관련사진보기


결과적으로 양측 다 제각기 기준을 통해 소속 당 후보에 유리한 결과 값을 홍보한 것으로 보인다. 윤관석 단장은 관련해 4일 <오마이뉴스>와 한 통화에서 "선거는 현재가 중요하다. 당시 발표하기 직전 시점을 기준으로 잡은 것"이라며 "애초 그 쪽(안철수)에서 기준 자체가 없었다. 저희가 안 후보 측 주장을 조목조목 팩트체크해서 거기 반론을 내놓은 것"이라고 설명했다.

반면 국민의당 김철근 대변인은 첫 논평 당시 수치를 쓰지 않은 것과 관련해 '쓰지 않았을 뿐 관련 데이터가 있었다'는 취지로 답변했다. 그는 3일 통화에서 "그 논평(4월30일)이, '한 달'이라는 수치가 들어가 있는 다음 논평(5월2일)으로도 이어지는 것"이라며 "저희가 백(back)데이터로 논평을 내는 것이지, 그냥 우기다시피 하는 건 아니다"라고 설명했다.  

검색 기준에 따라 결과값 달라져, 여론분석전문가 "보완자료로 참고해야"

구글트렌드는 검색 기간·지역·키워드 개수 등 기준에 따라 결과 값이 달라져 세심한 해석이 필요하다. 실제 4일 오전 11시경 구글트렌드에서 '문재인·안철수·홍준표' 키워드로 검색하자, '시간 흐름에 따른 관심도변화'는 문재인 61, 안철수 61, 홍준표 37 등으로 나타났다(기간:4월 4일~5월 4일, 지역:전 세계). 같은 기간, 지역을 '대한민국'으로 좁혔더니 이번에는 문재인 58, 안철수 55, 홍준표 33 등으로 문 후보가 근소하게 앞서는 것으로 나타났다.

이렇게 '구글 검색' 결과로 쓴 기사는 최근 들어 심심치 않게 찾아볼 수 있다. 관련해 지난 2월 17일 석간경제지 <헤럴드경제>가 구글 검색 값을 근거로 '구글 빅데이터의 예언... 대선 1위는 안철수'라는 제목의 기사를 낸 적도 있다. 그러나 해당 기사는 이유를 알 수 없게 현재 온라인상에서 삭제된 상황이다. 다만 같은 신문 미주판에서는 확인이 가능하다(해당 기사 보기).

윤희웅 오피니언라이브 여론분석센터장은 '구글트렌드' 검색에 대해 "검색 값은 특정 대상에 대한 인지도에 따라서 달라진다"면서도 "해당 검색 빈도가 많다고 해서 이를 지지율로 바로 치환시켜서 이해하기는 어렵다. 검색이 후보에 대한 호감·관심 때문인지 아니면 부정적 사건 때문인지 그 명확한 검색 의도를 알기 어렵기 때문"이라고 말했다.

그는 이어 "(관련한) 검색 의도를 알 수 없으므로 이를 (후보에 대한) 지지율로 바로 치환하기는 어렵다. 또 검색서비스를 60~70대가 사용할 가능성은 적으므로 결과가 유권자 전체의 대표성을 띄지 않는다는 점, 즉 이를 국민 여론으로 보기 어렵다는 것도 고려해야 한다"라고 덧붙였다. 윤 센터장은 "트렌드 값은 여론조사 결과 등의 보완자료로써 참고해 보는 것이 바람직하다"라고 설명했다.

대선이 6일 앞으로 다가온 가운데, 문재인(더불어민주당)-안철수(국민의당) 대선 후보 측이 구글트렌드 등 빅데이터 조사를 놓고 진실 공방을 벌이고 있다. 사진은 지난 5월 2일 마지막 대선TV토론에서 문재인-안철수 후보가 공방을 벌이는 모습.
 대선이 6일 앞으로 다가온 가운데, 문재인(더불어민주당)-안철수(국민의당) 대선 후보 측이 구글트렌드 등 빅데이터 조사를 놓고 진실 공방을 벌이고 있다. 사진은 지난 5월 2일 마지막 대선TV토론에서 문재인-안철수 후보가 공방을 벌이는 모습.
ⓒ MBC

관련사진보기


박한우 영남대 교수(언론정보학·빅데이터 서적 저자)도 "검색 결과와 여론조사 상관성은 0.5~0.6% 정도로, 관심도를 반영하는 건 맞다"라면서도 "다만 각 서비스 이용률·연관 검색어 관계·이용자 연령 등 다양한 변수를 고려해서 봐야 한다"고 말했다. 그는 또 "검색은 관심도이고, 이런 관심·주목도가 참여를 끌어내 투표까지 갈 확률이 높다. 연령 변수도 이전보다 완화된 편"이라며 검색 값이 후보 지지로 이어질 가능성이 높은 것으로 예측했다.

한편 국민의당 측은 4일에도 '네이버 트렌드'를 근거로 빅데이터 중요성을 강조했다. 김영환 미디어본부장은 이날 오전 당사 브리핑에서 '한 달간(4월 1일~30일) 네이버 검색 현황 분석' 자료를 근거로 "네이버는 한국 최대 검색 포털 사이트, 검색 현황은 후보자에 대한 국민 관심 수준을 나타낸다"며 "4월 분석 결과, 문재인-안철수 간 양강 구도가 지속해서 뚜렷이 나타난다. 두 후보(문재인·안철수) 관심도 차이는 약 6%정도로 보인다"고 말했다.

그는 이날 취재진과 만나 "분석 결과를 선거와 바로 연결 짓기는 어렵다. (이는) 후보에 대한 관심도를 보여주는 것"이라고 설명하면서도, 자료를 통해서는 "관심도는 후보자 지지와 밀접한 관계가 있다. 여론조사 신뢰성이 떨어지고 있는 현 상황에서 빅데이터 분석은 보다 정확한 여론의 향방을 알 수 있는 기준이 될 것"이라고 덧붙여 다른 설명을 내놓았다.


태그:#문재인, #안철수, #가짜뉴스, #진실 공방, #빅데이터
댓글20
이 기사가 마음에 드시나요? 좋은기사 원고료로 응원하세요
원고료로 응원하기

라이프플러스 에디터. 여성·정치·언론·장애 분야, 목소리 작은 이들에 마음이 기웁니다. 성실히 묻고, 세심히 듣고, 정확히 쓰겠습니다. Mainly interested in stories of women, politics, media, and people with small voice. Let's find hope!


독자의견

연도별 콘텐츠 보기