보고 싶은 것만 볼 땐 인지왜곡→확증편향→유유상종
"빅데이터는 만능 아냐…원료일 뿐, 해석이 중요하다"
[김봉구의 소수의견]은 통념이나 대세와 거리가 있더라도 일리 있는 주장, 되새겨볼 만한 의견을 소개하는 기획인터뷰입니다. 우리사회의 다양한 작은 목소리를 담아보려 합니다. <편집자 주>
지난 겨울 ‘태극기 집회’에서 주목할 점은 내용보다 형식에 있다. 리모컨은 스마트폰으로 바뀌었다. TV 채널을 틀던 손가락은 유튜브 동영상 플레이 버튼을 눌렀다. 온갖 정보가 카카오톡 채팅창을 옮겨 다녔다. 태극기 군중 동원의 일등공신은 뉴스가 아닌 카카오톡이었다.
“컴퓨터나 인터넷은 세대간 정보 격차가 있었죠. 스마트‘폰’이 나오면서 양상이 달라졌습니다. 전화기는 어르신들도 쉽게 사용할 수 있거든요.” 배영 숭실대 정보사회학과 교수(사진)가 현상의 맥을 짚었다. 매개체의 공유다. 그러나 담론의 공유로 이어지지는 않았다. 이 대목에 눈길이 머물렀다. 넷(net)은 ‘자유로운 연결’을 지향한다. 빅데이터 시대 도래로 정보의 양과 연결의 폭은 무한대에 가깝게 늘어났다. 그럼에도 우리는 갇혀 있다. 나아가 갈라져 있다. 왜 그런 것일까.
데이터를 만지는 사회학자에게 물어보고 싶었다. “세대별 경험과 관점이 다르니까요.” 배 교수의 설명이 이어졌다. “어떤 정보를 어디에서 얻는지도 중요하지만 ‘누구’와 연결돼 있느냐가 핵심입니다.” 숭실대 조만식기념관 그의 연구실에서 가진 인터뷰는 예정된 한 시간을 훌쩍 넘겼다.
- 문제는 네트워크다?
“똑같이 카카오톡을 사용해도 내용은 정반대다. 네트워킹 그룹 자체가 세대별로 분리돼 있다. 각자 살아온 경험과 사안을 바라보는 시각이 다르다. 그러다보니 그 안에서 자극적인 정보가 매우 적극적으로 공유된다. 생각의 격차는 갈수록 벌어지고.”
- 내부적 동질성과 외부적 배타성을 지닌 커뮤니티가 생겨났다.
“사회적 소통구조의 편향과 분절, 갈등으로 요약할 수 있다. 여기에는 SNS 같은 매체의 기본적 속성도 있고 탄핵이라는 특수한 국면의 영향도 있었다고 본다. 자신이 속한 그룹 안에서만 공유된 정보를 제한된 차원에서 인식하는 게 문제다. ‘가짜 뉴스’가 그렇게 퍼져나갔다.”
- 인터넷과 SNS, 빅데이터 등으로 이뤄진 ‘정보·접근성·네트워크 패키지’가 원래 예상이나 기대와 달리 오히려 확증편향을 강화하는 방향으로 가는 것 같은데.
“물적 조건이 결과를 담보하는 건 아니니까. 인터넷이 모든 사람과 정보를 연결한다는 건 이상론이다. 현실에서는 보고 싶은 것만 보고 입맛에 맞는 정보만 취사선택하고 있다. 인지왜곡은 확증편향 강화로 귀결된다. 사실로 믿어버리는 것이다. 동질적 그룹 안에서 이러한 확대재생산 사이클을 주고받으면서 ‘나’는 ‘우리’가 된다.”
- 그래서인지 페이스북 친구는 비슷한 생각의 사람들로 채워지더라.
“이른바 SNS의 유유상종 효과인데 결국 편익의 문제다. 입맛에 맞는 정보만 취했을 때보다, 낯설지만 새로운 정보를 취했을 때의 편익이 크다는 경험을 하면 달라지지 않을까. 사회학자 마크 그라노베터의 개념으로 보면 전자는 동질적 그룹의 ‘강한 유대’, 후자는 이질적 네트워크의 ‘약한 유대’가 된다. 강한 유대가 좋은 것만은 아니다.”
- ‘약한 유대의 힘(strength of weak ties)’. 역설적이다.
“오히려 약한 유대가 새로운 정보를 얻거나 더 큰 영향력을 발휘할 수 있다는 거다.”
- 약한 유대 개념이 최근에 나온 건 아니잖나. 빅데이터, 그러니까 미처 인지 못했던 훨씬 많은 새로운 정보가 나타나면서 뭔가 양태가 달라지지 않았을까?
“빅데이터에는 두 가지 차원이 섞여있다. 첫째, 데이터의 용량과 단위가 커졌다는 의미다. 둘째, 새로운 차원에서 나타난 무언가를 가리키는 고유명사다. 예전에도 이런 종류의 데이터는 존재하고 있었다. 여러 물리적 한계 때문에 활용이 안 됐을 뿐이다. 그런데 데이터를 다루는 저장·가공·활용기술이 발전하면서 그동안 거들떠보지 않았던 ‘데이터 더미’를 분석해 의미를 찾고 새로운 가치를 발견하게 된 거다.”
- 미국의 한 유통업체가 여고생에게 임신·출산용품 쿠폰을 보냈다. 아버지는 항의했지만 알고 보니 그 학생은 임신한 것으로 확인됐다. 유명한 빅데이터 분석 사례다.
“SNS든 행위 기반 데이터든 위치 정보든 간에 빅데이터 분석을 통해 무의식적인 생각과 행동 패턴까지 ‘가감 없이’ 볼 수 있다는 점이 중요하다. 스마트폰과 SNS를 쓰면서도 굉장히 많은 데이터가 생산된다. 기존에 분석 불가능했던 ‘비정형 데이터’다. 비교해보면 분명한 차이가 있다. 이전에는 사람의 인식이나 행위 패턴을 알아내기 위해 주로 설문을 했다. 설문에는 개인의 주관이나 조사 시점의 환경이 영향을 끼친다. 의도와 달리 편향(bias)이 생길 수밖에 없다. 반면 빅데이터는 민낯을 보여준다.”
- 그래서 대선 판세 분석에도 빅데이터를 활용하는 것인가.
“미국 대선에서 구글 트렌드를 활용해 트럼프의 당선을 예측하면서 각광받는 것 같다. 여론조사에서는 클린턴이 이기는 걸로 나왔으니까. 다만 빅데이터 분석만으로는 불안한 점이 있다.”
- 어떤 점에서?
“검색량 분석을 보자. 사람들이 언제 검색을 하나. 지지 후보를 검색해볼까? 글쎄. 그보다는 뭔가 사건이 생겼을 때 검색하겠지. 그렇다고 하면 특정 후보의 많은 검색량이 선호도와 비례한다고 보기 어렵다. 대선이 끝나고 빅데이터 분석 결과와 후보 선호도가 어떤 상관관계를 나타냈는지 검증해보면 재미있을 것이다.”
- 검색 행위를 일반화할 수는 없다는 얘기구나.
“예컨대 냉면을 검색했다면 냉면을 먹으러 갈 가능성이 높다. 촛불집회 당시 광화문을 검색했다면 이후 집회에 참석했을 것으로 추정할 수 있다. 즉 검색은 ‘행위의 시발점’이 된다. 이에 비해 인물 검색은 그에 대한 뉴스나 정보를 얻기 위한 것이다. 달리 봐야 하지 않을까.”
- 어떻게 하면 더 정밀하게 측정·분석할 수 있을까.
“만약 페이스북이 데이터 공개를 한다면 보다 세밀한 분석이 가능할 것이다. 페이스북에 특정 후보의 정보를 공유하는 행위는 적극적 지지 표명으로 해석할 수 있겠다. 긍정적 정보와 부정적 정보의 공유 비율 등을 따져보면 단순 검색량 분석보다는 의미 있는 결과가 나오지 않겠나.”
- 현재로선 불가능한데.
“데이터를 일종의 고려 요소로 보자. 단기적 시점의 데이터를 여론으로 받아들이기보다는 시계열적 추이와 경향성을 짚어보는 방향이 돼야 한다. 저도 분석할 때는 트위터 같은 SNS뿐 아니라 구글·네이버 트렌드, 언론 보도, 통계 자료까지 가능한 소스와 데이터를 다양하게 가져간다. 전반적 양상을 살펴 함의를 찾는 게 중요하니까.”
- 빅데이터가 만능은 아니다!
“데이터를 맹신하면 곤란하다. 데이터는 판단의 근거다. 판단 자체가 되어선 안 된다. 빅데이터가 모든 걸 해결해주지는 않는다. 해석의 영역이 중요하다.”
- 구슬이 서 말(빅데이터)이라도 꿰어야(해석) 보배, 이렇게 받아들이면 되나.
“비유하자면 빅데이터는 풍성한 원료다. 탄핵 국면을 빅데이터 분석했더니 최순실 사태보다 세월호 이슈가 전면에 드러났다. ‘더 이상 정부를 못 믿겠다, 대통령은 그 자리에 있지 말라’는 인식과 심리가 기저에 깔려있었다. 그 단초가 세월호였다. 세월호 참사가 없었다면 국정농단 사태가 알려졌어도 사람들은 반신반의했을 것이다. 이번처럼 급박하게 탄핵되지도 않았을 것 같고. 즉 최순실의 태블릿PC보다 세월호 영향이 컸다고 할 수 있다. 데이터에서 의미를 찾아내고 해석하는 작업이 필요한 이유다.”
- “뻔한 결론을 뭘 이렇게 힘들여 빅데이터 분석까지 했나” 싶을 때도 있는데.
“과정이 중요한 경우도 있다. 중동호흡기증후군(메르스) 관련 분석을 한다고 하자. 방역체계가 미비했고 전달체계에도 문제가 있었으며… 이런 결론에는 변함이 없다. 하지만 ‘어떤 지점에서, 정확히 무엇이 문제였는지’는 데이터를 통해 좀 더 세밀하고 구체적으로 파악할 수 있다.”
빅데이터는 정보기술(IT) 영역이라는 선입견이 있었다. 사회학자가 어떻게 빅데이터 연구자가 됐는지 궁금했다. “박사논문 쓸 때쯤 인터넷이 새로운 가능성의 공간으로 출현해서”라는 답변이 돌아왔다. 배 교수가 정보사회학이라는 조금은 특수한 분야에 발을 들여놓은 계기였다.
“온라인 커뮤니티 구성원은 얼굴도 본 적 없는 굉장히 약한 유대 관계잖아요. 그럼에도 타인에 헌신·희생하는 경우가 있더란 말이죠. 그게 사람의 고유한 속성인지, 아니면 온라인 공간의 특징인지 궁금하더군요.” 그의 관심사인 공동체 작동 메커니즘은 그대로 연구주제가 되었다. 그래서인지 배 교수는 현재의 갈등 상황을 부정적으로만 보지 않았다. “단절에 따른 상호 무지와 무관심이 가장 큰 문제입니다. 적어도 온라인과 모바일은 통로 기능을 갖고 있거든요. 문화적·제도적으로 소통의 기제를 찾는 노력이 더해지면 지금과 달라지겠죠.”
인터뷰를 마치고 돌아오는 길에 페이스북 앱을 열었다. 나와는 성향이 다르다고 여겨 팔로우 취소했던 몇몇을 다시 팔로잉 했다. 다소 낯설고 불편하지만 새롭고 다른 이야기들이 타임라인에 뜨기 시작했다.
김봉구 한경닷컴 기자 kbk9@hankyung.com
사진=최혁 한경닷컴 기자 chokob@hankyung.com
관련뉴스