실시간
뉴스

반도체

인텔 가우디3, IBM 클라우드 통해 첫 상용화

[사진=인텔]
[사진=인텔]

[디지털데일리 김문기 기자] 인텔(대표 립부 탄)은 IBM 클라우드와 손잡고 차세대 AI 가속기 ‘가우디 3(Gaudi 3)’의 첫 상용 클라우드 서비스를 시작한다고 9일 발표했다.

인텔은 IBM 클라우드가 가우디 3 AI 가속기를 탑재한 최초의 상용 클라우드 서비스 제공자로 나선다고 발표했다. 이는 가우디 3의 첫 대규모 상용 배포이자, 클라우드 기반 AI 인프라 시장에서 고성능·고비용 GPU 독점 구도에 변화를 주는 행보로 해석된다.

가우디 3은 생성형 AI, 대규모 언어모델 추론, 파인튜닝, RAG(검색 증강 생성) 등 최신 워크로드에 최적화돼 있다. 개방형 개발 프레임워크를 지원하며, IBM 클라우드 내에서는 독일 프랑크푸르트, 미국 워싱턴 D.C. 및 댈러스 리전에서 우선 제공된다. IBM VPC(가상 프라이빗 클라우드)에서 사용 가능하며, 왓슨엑스(watsonx), 레드햇 오픈시프트 등 주요 플랫폼과의 연동도 예정돼 있다.

AI 인프라 고도화가 가속화되는 가운데, 가우디 3의 가장 큰 강점은 ‘성능 대비 비용 효율’이다. 인텔이 의뢰한 시그널65의 최신 벤치마크에 따르면, 메타의 라마(Llama)-3.1-405B-FP8 모델 기준에서 경쟁 GPU 대비 92% 높은 비용 효율성을 기록했다. 또한, IBM의 크래나이트(Granite)-3.1-8B-인스트럭트(Instruct) 모델 기준으로는 처리 속도(TPS)에서 43% 우위를, Llama 모델 기준 대용량 워크로드에서도 36% 높은 처리량을 보였다.

사우라브 쿨카니 인텔 AI 전략 담당은 “이번 협력은 기업들이 AI를 보다 합리적인 비용으로 실용화할 수 있도록 돕는 전환점”이라며, “가우디 3은 클라우드에서의 추론·미세조정 작업에 최적화된 플랫폼”이라고 설명했다. IBM 클라우드 인프라 총괄 사틴더 세티 또한 “가우디 3은 고객에게 더 많은 선택권과 자유, 그리고 낮은 진입 장벽을 제공한다”고 강조했다.

디지털데일리 네이버 메인추가
x