지난 25일 전국에 걸쳐 발생한 KT 유·무선 통신 장애 원인에 대해 과학기술정보통신부가 정보보호·네트워크 전문가들과 함께 분석한 결과다. 과기정통부는 29일 정부서울청사에서 KT 통신장애 사고 조사 결과를 발표하면서 “매우 상식적인 게 지켜지지 않았고 관리, 기술 두 측면 모두 문제가 컸다”고 지적했다.
조사 결과에 따르면 KT 통신장애는 25일 오전 11시16분께 KT북부산국사에서 시작됐다. 협력업체 직원들이 기업망 장비를 교체한 뒤 원격으로 네트워크 경로설정(라우팅) 정보를 입력하던 중 명령어를 누락하는 실수를 했다. 라우팅은 통신 데이터가 알맞은 기기를 찾아 전달될 수 있게 해주는 일종의 데이터 주소 배정 과정이다. 명령어 오류가 나면 데이터가 제자리를 찾아갈 수 없다.
통신사가 주요 장비를 새로 들여 명령어를 입력할 땐 네트워크가 차단된 상태에서 작업하고, 스크립트(명령어 모음)가 제대로 구동하는지 사전 테스트를 거친다. 하지만 KT는 두 단계를 모두 어겼다. 사람이 직접 스크립트를 검토하는 사전검증 단계에서도 오류를 파악하지 못했다.
게다가 KT 전국 네트워크가 안전장치 없이 모두 하나로 연결돼 있어 문제가 더 커졌다. 북부산국사의 오류는 불과 30초 만에 전국으로 퍼졌다. 인터넷 서비스 장애에 놀란 이용자들이 단말 전원을 껐다가 켜면서 인터넷망과 별도로 운영되는 음성전화·문자 트래픽이 가중돼 전화 서비스도 일부 장애를 겪었다.
관리 부실도 드러났다. 당초 야간으로 계획한 작업계획서와 달리 통신 사용량이 많은 대낮에 작업이 이뤄졌다. 규정과 달리 KT의 감독자가 배석하지 않은 채 협력업체 직원들끼리만 주요 장비를 다뤘다.
이에 대해 KT는 “이번 사고처럼 예외적 일탈 사례가 나오지 않도록 관리를 강화할 것”이라고 밝혔다.
KT는 이날 오전 긴급 이사회를 열고 통신장애 피해보상안과 재발방지 대책 등을 논의했다. KT 관계자는 “정부와의 협의 등을 거쳐 보상안을 발표할 계획”이라고 말했다. 이어 “일부 전국망 단위에는 라우팅 오류 확산 방지 기능을 적용한 상태”라며 “오류 차단 기능을 확대하겠다”고 했다.
선한결 기자 always@hankyung.com
관련뉴스