현재위치 : > 뉴스 > 산업·IT·과학 > 게임·SW·포털·제약·바이오·과학

덩치만 키운 카카오…장애 대응은 '구멍가게' 수준

올해만 6번 장애 발생…예견된 장애였는데 대응 소홀 지적
전문가, "데이터센터 이원화 등 개선책 마련 시급" 한목소리

입력 2022-10-16 15:35 | 신문게재 2022-10-17 3면

  • 퍼가기
  • 페이스북
  • 트위터
  • 인스타그램
  • 밴드
  • 프린트
221016_SK C&C
15일 오후 화재가 발생한 경기 성남시 분당구 삼평동 SK 판교 캠퍼스 A동에서 소방관들이 진화작업을 하고 있다. (사진=연합뉴스)

 

지난 15일 발생한 카카오 서비스 대란은 전국적인 불편을 야기했다. 전 국민의 생활에 큰 영향을 미치는 주요 서비스인 만큼 확실한 재발 방지책을 세워야 한다는 데 비판의 목소리가 커지고 있다.

16일 과학기술정보통신부 및 관련 업계에 따르면 SK C&C 데이터센터 화재는 15일 오후 3시 19분경 전기실에서 발생했다. 3분 뒤 카카오의 장비가 위치한 구역에 전원 공급이 차단됐고 이로 인해 카카오톡을 비롯한 카카오의 주요 서비스 이용이 불가능해졌다.

10년 전 LG CNS 가산 데이터센터의 전력 공급 중단으로 카카오톡 서비스 중단 사태를 겪은 카카오는 또다시 같은 실수를 반복하면서 비판받는 모습이다.

카카오 측은 “모든 데이터를 국내 여러 데이터센터에 분산 백업하고 있다. 이번 화재가 발생한 직후 즉시 분산된 데이터센터에 이중화된 데이터를 통해 서비스 전환 처리 작업을 시작했다”고 해명했지만 IT 업계에서는 납득하기 어렵다는 반응을 보였다.

 

22101608


업계 관계자는 “여러 대규모 서비스를 운영하는 카카오가 이렇게까지 장애 대응이 느린 것은 이해가 가지 않는다. 백업 서버를 확실하게 마련해 놨다면 아무리 늦어도 몇 시간 안에는 정상화가 되었어야 한다”고 지적했다. 경쟁사 네이버도 해당 데이터센터에 입주해 있었지만 서비스 이용에 큰 차질을 빚지 않았다. 검색과 메일 등에서 여전히 오류가 발생 중이지만 피해를 최소화한 점에서 카카오와 대조적인 모습이다.

네이버 관계자는 “일부 기능에서 제한이 있긴 했지만 데이터센터를 이원화해 운영하고 데이터 분산 백업을 충실히 함으로써 피해를 최소화할 수 있었다”고 말했다.

자체 데이터센터가 없는 카카오와 달리 네이버는 춘천에 데이터센터 ‘각’(데이터센터 이름)을 운영하고 있으며 일부 서버는 분산 배치하는 등의 조치를 통해 서비스 장애를 대비했다. 제2 데이터센터 ‘각 세종’은 내년 2월 완공될 예정이다.

재난이 발생했을 때 빠른 대응을 위한 DR(재난 복구) 매뉴얼을 카카오가 제대로 갖췄는지도 의문이다. 카카오는 데이터센터의 화재가 진압되고 전원이 복구된 이후에도 서비스 정상화에 오랜 시간이 걸리고 있다.

 

2022101701020006619
카카오톡 등에서 15일 오후부터 동시다발적으로 발생한 장애가 장기화하면서 불편이 이어지는 가운데 16일 오후 경기 과천의 한 카카오T 주차장 무인정산기에 시스템 장애를 알리는 안내문이 붙어 있다.(연합)

지난 2014년에 발생한 삼성SDS 과천 데이터센터 화재와도 비교되고 있다. 당시 삼성SDS는 근처 PC방을 빌리고 드라이아이스를 이용해 11층에 있는 서버를 수원으로 옮기는 등 발 빠른 조치로 서버 복구에 성공한 바 있다.

국회 과학기술정보방송통신위원회 더불어민주당 박찬대 의원이 과학기술정보통신부로부터 제출받은 자료에 따르면 지난 5년간 카카오의 서비스 장애 건수는 총 19건에 달했다. 올해의 경우 이번 장애를 포함해 6건의 장애가 발생했다. 이처럼 서비스 장애가 잦은 상황에서도 카카오는 근본적인 개선책을 내놓지 않았고 결국 대형 사고로 이어졌다.

이번 사태의 1차 책임자인 SK C&C의 데이터센터 관리 부실도 고쳐야 할 부분이다. 서버 임대 공간이 아닌 전기실에서 화재가 발생했음에도 SK C&C 데이터센터는 서버실 전체 전원을 셧다운할수 밖에 없었고 결국 이번 사태를 야기했다.

업계 관계자는 “10년이 지났지만 IT 업계의 재난 대응 체계는 여전히 허술하다. 만약 데이터센터가 화재로 전소했다면 어찌 됐을지 상상 만해도 아찔해진다”며 “국민 생활에 큰 영향을 미치는 서비스를 제공하는 만큼 카카오의 확실한 대책 마련과 책임 있는 대응이 필요하다. SK C&C 역시 데이터센터 재난 대응 체계를 다시 한번 되짚어봐야 한다”고 말했다. 

 

박준영 기자 pjy60@viva100.com 

 

  • 퍼가기
  • 페이스북
  • 트위터
  • 밴드
  • 인스타그램
  • 프린트

기획시리즈

  • 많이본뉴스
  • 최신뉴스