[디지털데일리 이종현기자] 국민 소통 애플리케이션(앱)인 카카오톡이 15일 먹통이 됐다. 카카오톡을 기반으로 하는 카카오의 서비스 대다수도 마찬가지다. 데이터센터에 화재가 발생한 탓인데, 기본 중의 기본인 재해복구(Disaster Recovery, DR) 시스템이 정상 작동되지 않은 탓에 피해를 키웠다.
재해복구는 말 그대로 천재지변과 같은 재해가 발생함에 따라 데이터센터가 정상 작동하지 않을 때를 대비한 조치다. A 데이터센터의 가동이 멈추더라도 B 데이터센터가 그 일을 이어받도록 하는 것인데, 이는 안정적인 서비스 제공을 위한 기본적인 조치로 꼽힌다.
카카오는 대표 명의로 공지된 사과문을 통해 “모든 데이터를 국내 여러 데이터센터에 분할 백업하고 있으며 외부 상황에 따른 장애 대응을 위한 이원화 시스템을 가지고 있다”며 “화재 발생 직후 즉시 이원화 조치 적용을 시작했으나 이번과 같이 데이터센터 한곳 전체가 영향을 받는 것은 이례적인 상황으로 해당 조치를 적용하는 데 예상보다 오랜 시간이 소요되고 있다”고 밝혔다.
그러나 정보기술(IT) 업계에서는 카카오의 해명에 대해 납득하기 어렵다는 반응이 주를 이룬다. 애당초 재해복구 시스템은 데이터센터의 가동 중단을 염두에 두고 마련하는 것인데, ‘데이터센터 한곳 전체가 영향을 받는 이례적인 상황’ 탓에 시스템이 가동되지 않았다는 말은 앞뒤가 맞지 않는다는 것이다.
업계 관계자는 “카카오가 재해복구 시스템을 문제가 생긴 같은 데이터센터에 둔 것으로 알고있다. 데이터센터 자체에 문제가 생기다 보니 양쪽 모두에 문제가 생겨 재해복구가 제대로 가동하지 않은 것”이라고 말했다. 통상 재해복구 시스템의 경우 메인 시스템과 통상 40킬로미터(km) 이상 떨어진 곳에 두는 것을 원칙으로 한다.
그 원인으로는 ‘비용’을 들었다. 재해복구 시스템의 경우 워크로드가 많을수록 큰 비용을 감수해야 한다. 카카오처럼 많은 워크로드를 처리해야하는 기업으로서는 막대한 비용을 감수해야 하는 탓에, 비용절감을 위해 하나의 데이터센터에 메인서버와 재해복구 시스템을 함께 구축했을 것이라는 게 복수의 업계 관계자의 설명이다.
카카오가 재해복구 시스템을 메인 데이터센터와 가용영역(AZ)만 달리한 채 함께 뒀다면 제대로 된 재해복구 시스템을 구축했다고 보기 어렵다. 또 카카오만큼 거대 기업이 모든 워크로드를 하나의 데이터센터로 집중시켜두고, 재해복구 계획도 면밀하게 하지 않았다는 것은 비판의 소지가 크다.
실제로 여러 기업들이 비용 탓에 재해복구 시스템 구축을 망설이고 있는 것은 사실이다. 재해복구의 경우 예비 데이터센터를 이용해야 하는 만큼 추가 비용이 발생할 수밖에 없기에 중소기업이나 스타트업 등은 재해복구 시스템을 마련하지 못하고 있는 실정이다. 다만 카카오씩이나 되는 기업이 비용 때문에 재해복구 시스템을 제대로 갖추지 않았다는 것에 납득할 사람이 몇이나 있을까.
이번 논란으로 특히 곤경에 빠질 것은 카카오엔터프라이즈다. 기업들에게 재해복구 서비스를 제공해야 할 카카오엔터프라이즈가 비록 모회사의 문제 때문이라 할지라도 챗봇 등 서비스에서 차질을 빚은 것은 뼈아픈 일이다. 강점으로 활용되던 카카오톡 플랫폼이 단점으로 작용했다.
카카오가 비용 때문에 안전장치를 마련하지 않았다는 얘기가 도는 가운데 경쟁사인 네이버와 비교했을 때 IT 투자액이 낮은 점도 눈길을 끈다.
카카오와 카카오게임즈, 카카오페이, 카카오모빌리티, 카카오엔터프라이즈, 카카오뱅크 등 6개사가 밝힌 IT 투자액은 5892억원가량이다. 전체 매출의 11.4%를 IT에 투자한 셈인데, 네이버와 네이버클라우드, 네이버웹툰 등 3개사는 전체 매출의 24.6%를 IT에 투자했다. 2배 이상 차이난다. 카카오도 결코 적은 액수를 투자한 것은 아니나 위기 사태 이후 차이가 보이는 것은 어쩔 수 없는 일이다.
사회 전반에 영향을 끼친 만큼 만큼 이번 카카오 대란은 단순한 헤프닝으로 끝나지는 않을 것으로 보인다. 정부는 이번 사태를 계기로 주요 부가통신사업자에 대한 법제화 카드도 검토 중이다. 장애로 피해를 입은 이들이 소송을 진행할 것이라는 말도 나오고 있다. 카카오에 겨울이 일찍 찾아올 전망이다.