[디지털데일리 김문기 기자] 인텔(대표 립부 탄)은 IBM 클라우드와 손잡고 차세대 AI 가속기 ‘가우디 3(Gaudi 3)’의 첫 상용 클라우드 서비스를 시작한다고 9일 발표했다.
인텔은 IBM 클라우드가 가우디 3 AI 가속기를 탑재한 최초의 상용 클라우드 서비스 제공자로 나선다고 발표했다. 이는 가우디 3의 첫 대규모 상용 배포이자, 클라우드 기반 AI 인프라 시장에서 고성능·고비용 GPU 독점 구도에 변화를 주는 행보로 해석된다.
가우디 3은 생성형 AI, 대규모 언어모델 추론, 파인튜닝, RAG(검색 증강 생성) 등 최신 워크로드에 최적화돼 있다. 개방형 개발 프레임워크를 지원하며, IBM 클라우드 내에서는 독일 프랑크푸르트, 미국 워싱턴 D.C. 및 댈러스 리전에서 우선 제공된다. IBM VPC(가상 프라이빗 클라우드)에서 사용 가능하며, 왓슨엑스(watsonx), 레드햇 오픈시프트 등 주요 플랫폼과의 연동도 예정돼 있다.
AI 인프라 고도화가 가속화되는 가운데, 가우디 3의 가장 큰 강점은 ‘성능 대비 비용 효율’이다. 인텔이 의뢰한 시그널65의 최신 벤치마크에 따르면, 메타의 라마(Llama)-3.1-405B-FP8 모델 기준에서 경쟁 GPU 대비 92% 높은 비용 효율성을 기록했다. 또한, IBM의 크래나이트(Granite)-3.1-8B-인스트럭트(Instruct) 모델 기준으로는 처리 속도(TPS)에서 43% 우위를, Llama 모델 기준 대용량 워크로드에서도 36% 높은 처리량을 보였다.
사우라브 쿨카니 인텔 AI 전략 담당은 “이번 협력은 기업들이 AI를 보다 합리적인 비용으로 실용화할 수 있도록 돕는 전환점”이라며, “가우디 3은 클라우드에서의 추론·미세조정 작업에 최적화된 플랫폼”이라고 설명했다. IBM 클라우드 인프라 총괄 사틴더 세티 또한 “가우디 3은 고객에게 더 많은 선택권과 자유, 그리고 낮은 진입 장벽을 제공한다”고 강조했다.
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
유료방송업계, 국민의힘에 정책제안서 전달…케이블TV는 “지역기반성장” 강조
2025-05-22 17:55:29[DD퇴근길] 法 "카카오T, 콜 몰아주기 아냐"…공정위 과징금 취소 판결
2025-05-22 17:36:59KT, 국내 제조업 겨냥 AX사업 드라이브…“AI 전환 전방위 지원”
2025-05-22 15:52:19과기정통부, SKT 침해사고 계기 정보보호 투자 확대방안 논의
2025-05-22 14:00:00SKT, 유심교체 3일간 100만명…"고객 유심교체 집중"
2025-05-22 11:29:55네이버·엔비디아 기술 동맹?…이해진, 대만서 젠슨 황 만났다
2025-05-22 20:37:19"위믹스 상폐는 담합" 위메이드, 닥사 소속 거래소 공정위 신고
2025-05-22 19:34:43'혐한' 논란 글로벌 인기작, 게임위 등급분류 받았다…국내 출시될까
2025-05-22 19:02:17공정위 칼날에 꼬리 내린 구글… ‘유튜브 라이트’ 요금제 출시한다
2025-05-22 18:59:06[DD퇴근길] 法 "카카오T, 콜 몰아주기 아냐"…공정위 과징금 취소 판결
2025-05-22 17:36:59