“국민 메신저로 불리는 카카오톡 서비스가 주말 수시간 동안 멈춰섰다. 인터넷데이터센터(IDC)에 전력 장애가 발생한 탓이다.”
2012년 4월 말 한경닷컴에 올라온 기사의 한 대목이다. 그로부터 10년6개월 뒤인 지난 주말, 카카오톡은 또다시 20시간 이상 서비스 장애를 겪었다.
이번 사태는 2012년과 비슷한 점이 많다. IDC 전력 공급이 원활치 않아 카카오 서비스가 중단됐다는 점, 예상보다 복구에 오랜 시간이 걸렸다는 점 등이 똑같다. 전문가들이 지적하는 구조적인 문제도 다를 게 없다. 이용자가 4000만 명 넘는 매머드급 서비스임에도 특정 데이터센터에 의존도가 지나치게 높다는 대목이다.
10년 전과 달라진 점도 있다. 나쁜 쪽으로다. 과거엔 메신저 서비스 하나가 서너 시간 멈췄다. 이번엔 사회 각 영역에서 최소 반나절 이상 서비스 장애가 발생했다. 카카오가 그간 흡수한 서비스가 여럿인 까닭이다.
카카오의 국내 계열사 수는 지난 5월 기준 136개에 달한다. 삼성그룹의 국내 계열사(58개)보다 두 배 이상 많은 수다. 돈이 오가는 결제서비스(카카오페이)부터 교통, 콘텐츠, 커뮤니티 등 여러 분야 서비스가 그대로 멈췄다. 전국 택시 기사의 93%가 가입한 ‘생업 플랫폼’ 카카오T도 마찬가지였다.
데이터센터 운영사의 관리 탓을 하기도 어렵다. 같은 데이터센터를 이용하는 다른 기업들의 서비스엔 심각한 문제가 없었기 때문이다. 네이버는 뉴스와 쇼핑 검색 등 일부 서비스에 장애가 발생했지만 네이버페이 등 결제·구매 서비스엔 아무런 문제가 없었다. 메인 서버를 자체 데이터센터에 두고, 나머지 서버는 분산해 둔 덕이다. 반면 카카오는 경기 판교 데이터센터가 주요 서비스 대부분을 담당했다. 안양 등에도 데이터센터를 두고 있지만 메인 데이터센터의 빈자리를 채우기엔 역부족이었다.
이쯤 되면 카카오의 비상 재해복구(DR) 대책이 미흡했다는 지적이 나오지 않을 수 없다. 시가총액 10위 규모로 덩치가 커졌음에도 사고에 대한 대비 수준은 스타트업을 막 벗어나 중견기업에 진입했던 10년 전과 다를 게 없기 때문이다.
카카오는 “이원화 시스템을 두고 있고, 화재 인지 즉시 적용을 시작했으나 적용에 예상보다 오랜 시간이 소요됐다”고 해명했다.
하지만 업계의 반응은 싸늘하다. 이원화는 한 곳에 문제가 생겼을 때 다른 곳이 서비스를 떠받쳐주는 일이지, 단순히 서버를 여러 곳에 두는 게 아니란 지적이다. ‘이원화했는데 이원화되지 않았다’는 해괴한 해명으론 국민들의 마음을 돌리기 어려워 보인다.
관련뉴스