[디지털데일리 백지영기자] 클라우드 서비스 기업이 반도체 업계의 큰 손으로 자리한지 오래다.
개별 기업들이 서버, 스토리지 등 IT 장비를 개별적으로 구매하는 것보다 클라우드 사업자(하이퍼스케일러)의 구매 비용이 압도적으로 늘어나면서 아마존웹서비스(AWS)와 마이크로소프트(MS), 구글과 같은 기업들의 파워가 이전보다 커졌다.
이들은 전세계에 수십개의 데이터센터를 운영하고 있으며 계속해서 확장 중이다. 현재까지 서버 프로세서(CPU)에선 사실상 인텔의 독점이 이뤄졌다. 인텔 제온 프로세서는 글로벌 X86 서버 칩 시장의 98% 이상을 차지하고 있다. 클라우드 서비스에도 ‘인텔 인사이드’라는 공식이 성립됐다.
하지만 최근 가성비가 중요해지고 머신러닝, 딥러닝 등 인공지능(AI) 등 특화된 워크로드 활용이 늘어나면서 엔비디아를 비롯해 AMD, ARM 등의 존재감이 커지고 있다.
그중에서도 전세계 1위 클라우드 기업 AWS는 반도체 전쟁의 정점에 있다. AWS은 최근 개최한 자사의 연례 컨퍼런스인 ‘AWS 리인벤트’에서 여러 기업의 프로세서(칩)를 탑재한 새로운 컴퓨트 인스턴스(EC2) 서비스를 대거 출시했다.
특히 AWS은 지난 2015년 인수한 안나푸르나랩스를 통해 확보한 ARM 기반 칩 기술을 바탕으로 이미 ‘그래비톤 프로세서’ 기반의 컴퓨팅 서비스를 제공하고 있다. 올해 행사에서도 AWS는 현재 제공 중인 인텔 x86 프로세서 기반 C5 인스턴스보다 40% 이상 성능이 높은 그래비톤2 프로세서 기반의 EC2 C6g 인스턴스를 발표했다. 이는 고성능컴퓨팅(HPC)과 배치처리, 게임, 분산형 분석 등에 적합한 인스턴스다.
앤디 재시 AWS CEO는 “그래비톤 기반 서비스는 인텔 기반 장비에서 돌아가는 서비스들과 비교해 40% 나은 가격 대비 성능을 보여준다”고 강조했다.
이와 함께 머신러닝 모델 학습(트레이닝)에 특화된 프로세서도 내년 ‘AWS 트레이니엄’이라는 이름으로 출시할 예정이다. 이는 AWS GPU 인스턴스 대비 45% 낮은 비용으로 30% 높은 쓰루풋(처리량)을 보장한다. 이는 AWS가 지난해 출시한 머신러닝 추론용 인스턴스인 ‘인퍼런시아’를 보완한다. 인퍼런시아는 머신러닝 인프라 비용의 최대 90%를 차지하는 머신러닝 추론 관련 비용을 해결했지만, 여전히 많은 기업이 머선러닝 학습에도 많은 비용 부담을 안고 있다는 설명이다.
AWS이 자체 개발한 맞춤형 칩을 늘리고 있지만, 인텔은 여전히 AWS 인프라를 지탱하는 가장 중요한 파트너다. 올해는 인텔이 2019년 인수한 이스라엘 인공지능(AI) 가속칩 스타트업인 하바나랩스의 ‘가우디’ 프로세서를 탑재한 딥러닝 학습용 EC2 인스턴스가 발표돼 주목을 받았다.
8개의 하바나 가우디 가속기를 활용한 AWS EC2 인스턴스는 동일한 가격대의 머신러닝 워크로드용한 EC2 인스턴스 기반 GPU 대비 40% 향상된 성능을 지원한다. 가우디 가속기는 자연어 처리, 객체 감지, 머신 러닝 훈련, 분류, 추천, 개인화 등을 포함하는 워크로드에 대한 딥 러닝 모델을 훈련하기 위해 특별히 설계된 제품이다. 텐서플로와 파이토치 프레임워크를 지원한다.
이와 함께 AWS은 가장 빠른 인텔 제온 스케일러블 프로세서를 적용해 웹과 DB, 게이밍 등 네트워크 집약적인 워크로드에 맞는 EC2 M5 인스턴스도 출시했다. M5zn 인스턴스의 경우 100Gbps 의 고속네트워킹과 4.5GHz의 고주파수가 적용된 인텔 CPU를 채택하고 있다.
레미 엘 우아잔 인텔 데이터 플랫폼 그룹 최고전략책임자(CSO)는 “클라우드 제공업체들은 AI 추론 워크로드를 진행하기 위해 인텔 제온 프로세서에 내장된 AI 성능을 활용하고 있다”며 “이와 더불어 인텔은 하바나로 AI 모델 훈련 비용을 합리적인 가격으로 제공해 보다 경쟁력 있는 대안을 제시할 수 있게 됐다”고 강조했다.
AMD 역시 지난 2018년부터 15곳 이상 글로벌 AWS 리전에 M5a, M5ad, R5a, R5ad, T3a 등 다양한 EC2 인스턴스를 제공하고 있다. 올해는 AMD의 2세대 에픽 프로세서(CPU)와 라데온 프로 V520(GPU)을 적용한 EC2 G4ad가 새롭게 출시됐다. G4는 게임 스트리밍이나 렌더링과 같이 그래픽 집중적 워크로드에 최적화된 성능을 제공하는 컴퓨팅 서비스다.
AMD에 따르면, 이는 자사 7nm 공정 기반 CPU와 GPU를 탑재한 최초의 AWS 인스턴스다. 타 GPU 기반 아마존 EC2 G4dn 인스턴스(엔비디아) 대비 최대 45% 높은 가성비와 40% 향상된 그래픽 성능을 제공한다는 주장이다. AMD는 이번 인스턴스 공급과 함께 전 세계 20개 지역에 총 8개의 EC2 인스턴스를 지원하게 됐다는 설명이다.
AMD와 마찬가지로 G4 인스턴스를 제공하는 엔비디아 역시 최근 AWS에서의 비중을 늘리고 있다. 엔비디아 GPU가 탑재된 G4dn 인스턴스에는 인텔 캐스케이드 레이크 CPU와 함께 제공돼 머신러닝 추론과 학습에 적합하다.
이밖에 AWS는 처음으로 맥 OS를 서비스로 제공하는 ‘맥OS 인스턴스’를 공개했다. 이를 통해 개발자들은 맥 기기 업싱도 맥OS나 iOS용 애플리케이션을 개발, 테스트할 수 있다. 이는 애플 맥미니 하드웨어(인텔 8세대 코어 i7 프로세서)를 AWS 니트로 가상화 계층에서 제공한다. AWS 니트로 플랫폼은 ARM 기반 그라비톤2 프로세서를 기반으로 한다. AWS는 내년 애플 M1칩도 지원할 예정이다.