실시간
뉴스

소프트웨어

[OCW 2024] 역대 최고사양…오라클, AI 워크로드 위한 ‘OCI 슈퍼클러스터’ 공개

클레이 마고요크 OCI 개발 총괄 부사장
클레이 마고요크 OCI 개발 총괄 부사장

[디지털데일리 이안나기자] 오라클이 규모에 상관없이 고객이 원하는 수준의 리전을 준비해 선택권을 제공하겠다는 계획을 밝혔다. 단 3개 랙으로 구성된 오라클 클라우드 인프라스트럭처(OCI) 전용 리전을 소개하면서 동시에 차세대 인공지능(AI) 워크로드를 위한 슈퍼클러스터도 공개했다.

9~12일(현지시간) 미국 라스베이거스 베네치안 컨벤션 센터에서 개최된 오라클 연례 컨퍼런스 ‘오라클 클라우드월드 2024’ 행사에서 클레이 마고요크 OCI 개발 총괄 부사장은 “AI 모델 훈련엔 가장 고성능인 GPU 클러스터가 필요하다”며 최신 OCI 슈퍼클러스터를 소개했다.

OCI는 현재 클라우드 사상 최고 사양을 자랑하는 AI 슈퍼컴퓨터에 대한 주문을 접수 중이다. 최대 13만1072 엔비디아 블랙웰 GPU를 탑재할 수 있고, 최초로 2.4제타플롭 피크 성능을 제공한다. OCI 슈퍼클러스터 최대 GPU 확장 규모는 프론티어 슈퍼컴퓨터 대비 3배, 다른 하이퍼스케일러 대비 6배 이상 크다.

OCI 수퍼클러스터에는 OCI 컴퓨트 베어메탈, 초저지연성 RoCEv2와 커넥트X-7 NIC 및 커넥트X-8 수퍼NIC 또는 엔비디아 퀀텀-2 인피니밴드 기반 네트워크와 하나의 HPC 스토리지가 포함된다.

오라클은 최대 규모 GPU 클러스터를 지원하기 위해 인프라 수준을 높였다. 특히 마고요크 부사장은 이 슈퍼클러스터가 초당 310쿼드릴리온(경) 패킷을 처리하는 네트워크를 구현한다고 강조했다. 네트워크는 규모가 클수록 구현이 기하급수적으로 어려워진다.

냉각 기술도 중요하다. 보통 랙은 구동에 10~15킬로와트(kw)가 필요해 팬이 차가운 바람을 불어 냉각시킨다. 하지만 GPU 기반 AI 클러스터는 훨씬 더 많은 전력을 요구한다. 빽빽하게 채워진 랙 안까지 냉각이 필요하기에 데이터센터 모양도 변하고 있다는 게 마고요크 부사장 설명이다.

그는 “각 GPU는 1000와트(W) 기존 냉각방식으론 고밀도 GPU 클러스터를 효과적으로 냉각할 수 없어, OCI 슈퍼클러스터는 액체냉각 방식을 도입했다”며 “이는 더 작은 공간에 더 많은 전력을 사용하는 형태지만 성능·가용성·보안 및 경제성에 대한 끊임없는 집중 덕분에 AI 고객들은 OCI를 선택하고 있다”고 전했다.

OCI 슈퍼클러스터의 실제 활용 사례로 ‘그록2(Grok-2)’가 소개됐다. 그록2는 채팅, 추론, 이미지 이해, 코드 생성 등 다양한 기능을 갖춘 멀티모달 AI 모델로, OCI 슈퍼클러스터에서 훈련되고 운영되고 있다.

OCI 슈퍼클러스터를 통해 고객들은 가장 까다로운 AI 워크로드도 효율적으로 처리할 수 있게 됐다. 마고요크 부사장은 “가장 작은 전용 리전부터 가장 큰 슈퍼클러스터까지 끊임없는 혁신을 통해, OCI는 전 세계 고객들에게 규제 준수와 선택의 자유를 제공할 것”이라고 강조했다.

디지털데일리 네이버 메인추가
x