지난 주 세계최대의 클라우드 서비스인 아마존 EC2(Elastic Compute Cloud)의 장애 소식이 화제가 됐었습니다. 이 때문에 아마존 EC2를 사용하는 징가, 포스퀘어, 넷플릭스 등 세계적 서비스들도 중단될 수밖에 없습니다. 무려 11시간이나 중단된 서비스도 있다고 합니다.
이번 사태는 클라우드 서비스에 장애가 발생했을 때 벌어질 사태를 보여주는 단적인 사례입니다. 클라우드 서비스에 장애가 발생하면, 이를 이용하는 모든 서비스가 중단될 수밖에 없습니다. 서비스가 중단된 업체들은 원인도 모른 채 발만 동동 구를 수 밖에 없습니다. 자신의 데이터센터 내에서 벌어진 일이 아니기 때문입니다.
기업들이 ‘내 서비스를 내가 책임지지 못하는 것은 불안하다’는 인식이 강해지면 활성화 되고 있는 클라우드 컴퓨팅 시장에 악영향을 미칠 수도 있습니다. 가뜩이나 클라우드에 대한 막연한 불안감이 있는데, 이번 장애소식은 이에 결정적 증거가 되고 있습니다.
외국 언론들도 클라우드 컴퓨팅의 신뢰에 빨간 불이 켜졌다고 보도하고 있습니다.
뉴욕타임즈는 “아마존의 장애가 클라우드 컴퓨팅에 대한 의구심을 키운다”고 보도했고, 포브스지는 “클라우드 컴퓨팅이 죽은 날”이라고 말했습니다.
클라우드 컴퓨팅에 대한 위험성이 부각되자 구글은 재빨리 자신들은 아마존과 다르다고 강변하고 있습니다.
아마존과 함께 클라우드 컴퓨팅 산업을 이끌고 있는 구글은 22일 기업용 구글 앱스 사이트에 자사의 데이터센터가 얼마나 안전한지 증명하기 위한 설명과 동영상을 올렸습니다. 아마존 사고 하루만에 이런 동영상을 올리다니 정말 발 빠른 구글입니다.
동영상은 남부 캘리포니아에 있는 데이터 센터를 통해 실제 직원의 센터 출입 절차, 24 시간 보안 시스템, 하드웨어 유지 보수 시스템, 방재 시스템과 같은 모습을 소개하고 있습니다.
데이터센터에 출입하기 위해서는 망막 검사 등 생체인증을 받아야 하며, 수명이 다한 하드디스크 등 하드웨어는 물리적으로 완전히 분쇄합니다. 또 고객의 데이터는 여러 데이터센터에 분산 복제돼 있기 때문에 데이터를 잃어버릴 일은 없다고 강조합니다. 또 친환경적인 데이터 센터임을 설명하는 것도 잊지 않습니다.
아마존이 망가진 틈을 타서 재빨리 자사의 안정성을 자랑하면서, 클라우드 컴퓨팅에 대한 불신을 불식하고자 하는 의도가 엿보입니다.
하지만 아무리 준비를 잘 해놓았다고 하더라도 문제는 예상치 못한 곳에서 벌이진다는 것이 문제입니다. 지진에 관한 한 그렇게 철저히 준비했다던 일본도 지난 동북지방 지진과 쓰나미에는 속수무책으로 당했습니다.
아마존도 보안과 서비스의 고가용성을 위해 구글 못지 않은 투자를 해왔습니다. 아마존에는 특정 데이터센터가 장애를 겪으면 이를 복구하는 동안 서비스를 지속할 수 있도록 하기 위해 보조 데이터센터인 ‘가용성 존’이 있습니다. 하지만 본 데이터센터와 가용성 존을 연결하는 네트워크가 부하를 뒷받침하지 못한 것이 이번 사태의 원인이라고 합니다. 장애에 대한 준비를 철저히 했다고 자부했지만, 예상치 못한 부분에서 문제가 생긴 것입니다.
아마 앞으로도 클라우드 서비스 장애 문제는 지속적으로 등장할 것입니다. 100% 완벽한 IT시스템은 없기 때문입니다.
때문에 클라우드 컴퓨팅은 앞으로도 지속적으로 ‘안정성 vs 편리성’ 중에 무엇을 선택할 것이냐의 문제가 될 것으로 보입니다. 클라우드 컴퓨팅은 비용절감, 서비스 확장성 및 유연성, 서비스 개발속도 향상 등에 큰 효과가 있지만, 계란을 한 바구니에 담는 위험성도 있기 때문입니다.
하지만 클라우드 데이터센터가 언제나 오류를 일으킬 가능성을 가지고 있듯, 기업내의 IT시스템도 문제를 일으킬 수 있습니다. 다만 문제가 일어났을 때 직접 대처할 수 있다는 점이 다를 뿐입니다. [심재석기자 블로그=소프트웨어&이노베이션]