[디지털데일리 김문기 기자] AMD(대표 리사 수) 28일(현지시간) AI 관련 개방형 컨소시엄인 ML커먼즈(MLCommons)의 웹사이트를 통해 AMD 인스팅트 MI300X GPU를 사용한 ML퍼프(MLPerf)의 첫 벤치마크 결과를 공개했다.
제출 가능한 벤치마크 유형에는 ML퍼프 인퍼런스: 데이터센터(MLPerf Inference: Datacenter), ML퍼프 트레이닝(MLPerf Training), 2024년 도입된 최첨단 대규모 젠AI(GenAI) 언어 모델인 라마 2 70B(Llama 2 70B) 등이다. AMD는 이들 중 널리 사용되는 LLM인 라마 2 70B를 채택했다.
AMD는 ML퍼프 인퍼런스 v4.1 테스트 결과에 대해 AI 작업을 위해 시중에서 판매되는 AMD CPU및 GPU의 최상의 조합이라고 자평했다. MI300X의 대용량 메모리(192GB)를 통해 단일 MI300X GPU로 전체 라마 2 70B 모델 실행이 가능함을 입증했다. AMD의 차세대 CPU를 통한 AI 작업 성능 개선도 이뤘다는 평가다.
AMD는 “ML퍼프 4.1 인퍼런스 테스트 결과는 ROCm를 기반으로 한 MI300X이 라마 2 70B와 같은 대규모 LLM에 대해 뛰어난 추론 성능을 제공함을 증명했으며, 라마 2 70B LLM이 포함된 엔비디아(Nvidia)의 H100과 같은 경쟁 제품의 테스트 결과에 대한 비교도 제공했다”고 밝혔다.
아울러 “AMD 인스팅트 MI300X GPU 가속기를 탑재한 차세대 5세대 AMD 에픽(코드명 튜린) CPU의 성능 향상을 입증했으며, 서버 시나리오에서 인텔 제온을 탑재한 엔비디아 DGX H100보다 약간 앞서고 FP8 정밀도에서 오프라인 시나리오의 경우 비슷한 성능을 유지했다”고 덧붙였다.
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
주파수 재할당대가, 정부가 부르는게 값? “산정방식 검토 필요”
2024-11-22 18:23:52유료방송 시장, 역성장 지속…케이블TV 사업자 중 SKB 유일 성장
2024-11-22 13:28:49[디즈니 쇼케이스] 판타스틱4, MCU 합류…미소 짓는 케빈 파이기
2024-11-22 12:56:31LGU+, 기업가치 제고 계획 발표…"AX 컴퍼니 구조 전환 가속화"
2024-11-22 10:18:34LG헬로 송구영 대표이사 재선임…사업 수익성 개선 '총력'
2024-11-21 18:33:01드림어스컴퍼니, 자본준비금 감액해 이익잉여금 500억원 전입
2024-11-22 14:57:25야놀자·인터파크트리플, 12월 ‘놀 유니버스’로 법인 통합
2024-11-22 14:57:10논란의 ‘퐁퐁남’ 공모전 탈락…네이버웹툰 공식 사과 “외부 자문위 마련할 것”
2024-11-22 14:23:57쏘카·네이버 모빌리티 동맹 순항…네이버로 유입된 쏘카 이용자 86%가 ‘신규’
2024-11-22 12:58:15