앞서 지난 28일 AWS의 미국 동부-1 지역의 스토리지 서비스(S3)에 장애가 발생하면서 약 11시간 동안 이를 이용하는 다수의 웹사이트 등이 다운되거나 느려지는 피해를 입었다. S3와 연계된 엘라스틱블록스토어(EBS), 람다 등 여러 서비스도 제대로 작동하지 않았다.
2일(미국 현지시각) AWS는 자사 홈페이지를 통해 “S3 과금시스템이 느리게 진행되는 문제를 해결하는 과정에서 공인된 S3팀의 구성원이 기존 플레이북을 사용해 S3 결제 프로세스에서 사용되는 서브시스템 중 하나를 위해 다수의 서버를 삭제하는 명령(커맨드)을 실행하면서 문제가 발생했다”고 사과했다.
즉, 잘못된 명령어 입력을 통해 여러대의 서버를 삭제하면서 S3 서브시스템을 지원하는 다수의 서버가 다운된 것이다. 이에 따라 AWS 미국 동부-1 지역의 S3 서브시스템을 새롭게 시작해야 했고, 예상보다 시간이 오래 걸렸다는 설명이다.
AWS는 이번 장애로 내부 툴과 프로세스 절차를 바꿨다고 밝혔다. 툴이 용량을 좀 더 느리게 제거하도록 수정했으며, 세이프가드 기능을 추가해 서브시스템의 최소 필요 용량 밑으로 제거되는 것을 방지했다. 또 장애가 발생한 노던버지니아(미국 동부-1)의 데이터센터에서만 돌아가던 AWS의 서비스 헬스 대시보드도 여러 리전에서 구동되도록 바꿨다.
<백지영 기자>jyp@ddaily.co.kr
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
KT, 업무시스템 전면 전환…'카이로스X' 프로젝트 돌입
2025-04-20 21:50:10[AI시대, ICT 정책은③] 콘텐츠산업 육성 예산, 전체의 0.14%…"국가 전략 산업으로 키워야"
2025-04-20 16:43:07[OTT레이더] '김혜자♥손석구' 현생 초월 로맨스 시작, 넷플릭스 '천국보다 아름다운'
2025-04-20 10:27:39[인터뷰] 26만 이용자 입과 귀 돼주는 ‘손짓’...KT수어상담사가 보람 느낀 순간은?
2025-04-20 09:00:00유료방송-FAST 新 협력모델 제안…“통합 에코시스템 구축 필요”
2025-04-19 17:37:27[AI시대, ICT 정책은②] 네트워크 준비지수 5위인데…우리 정부는 준비됐나
2025-04-19 08:00:00[툰설툰설] 연애 세포 살리는 로맨스…'입맞추는 사이' vs ‘내일도 출근!’
2025-04-20 14:41:20日 택시단체 "호출서비스 인상적"…카카오모빌리티와 DX 협력 모색
2025-04-20 13:47:00사내맞선·악연…카카오엔터 웹툰 IP 흥행, '바니와 오빠들'도?
2025-04-20 13:44:05네이버, 좌표찍기 알림 공지 시스템 도입…최수연 "이달 내 적용"
2025-04-18 19:04:20