[디지털데일리 이종현기자] 클라우드 인프라는 서버를 가상화(Virtualization)해 필요에 따라 늘리거나 줄이는 것이 쉽다는 것을 강점으로 내세운다. 트래픽에 따라 서버 사이즈를 자동으로 조정하는 오토 스케일링(Auto Scaling)까지 도입한다면 트래픽 과부하로 서버에 문제가 생기는 일은 없어야 한다.
하지만 클라우드 시대에도 여전히 많은 기업 서비스가 트래픽 폭주로 인한 장애를 겪고 있다. 이용량이 몰릴 때의 배달 애플리케이션(앱)이나 온라인 게임 등이 대표적이다.
지난 13일 출시한 온라인 게임 ‘언디셈버’의 경우 클라우드를 채택했음에도 트래픽 폭주로 잦은 점검을 하는 중이다. ‘쿠키런 킹덤’ 역시 클라우드를 사용했음에도 트래픽 과부하로 24시간 이상 점검을 한 사례가 있다.
업계에서는 클라우드 사업자의 문제는 아닐 것이라고 말한다. 실제 클라우드 사업자들은 미국 블랙프라이데이나 중국 광군제 등, 막대한 트래픽에도 불구 서비스를 제공한 경험이 있다. 배달 주문자나 게임 이용자가 몰린다고 해서 서버에 문제가 생기지는 않는다는 것이 업계 관계자의 설명이다.
서비스 장애의 경우 문제의 원인은 다양하나, 대부분의 경우 소프트웨어(SW)가 높은 트래픽을 감당하도록 설계되지 않은 데 있다. ‘아키텍처의 문제’ SW의 확장성이 낮다면 슈퍼컴퓨터라 하더라도 문제가 생길 수밖에 없다.
작년 12월 네이버클라우드의 자체 온라인 행사 연기 사태가 대표적이다. 15~16일 진행 예정이었던 행사는 기술 트러블로 인해 16~17일로 연기됐다. 당초 접속자 폭주로 인한 문제라고 밝혔으나 클라우드 기업이 1만명 남짓의 접속자를 감당하지 못해 장애가 발생했다는 것에 의문부호가 붙었다. 결국 클라우드와는 별개의 기술 트러블로 확인됐다.
물론 클라우드 사업자에 의한 장애도 없지 않다. 아마존웹서비스(AWS)의 경우 작년 12월 3번의 장애가 발생했다. 암호화폐 거래소 코인베이스, 게임 기업 에픽게임즈, 동영상 스트리밍 기업 홀루+, 기업용 메신저 슬랙, 무료 이미지 호스팅 사이트 임구어(Imgur) 등이 피해를 입은 바 있다.
여기서 알 수 있는 사실은, 클라우드 도입 기업의 서비스가 겪는 장애는 클라우드의 탓이 아닐 확률이 높다는 것, 또 클라우드가 모든 문제를 해결해줄 수 있는 요술램프가 아니라는 것이다.