인텔 차세대 AI 프로세서, 엔비디아 'A100' 성능 넘었다

김도현 2022.07.01 16:24:27

- 엠엘퍼프 벤치마크 공개…7나노 공정 활용

[디지털데일리 김도현 기자] 인텔의 차세대 인공지능(AI) 프로세서가 엔비디아 동급 제품 성능을 넘어선 것으로 나타났다. 인텔은 기존 중앙처리장치(CPU)에 이어 AI 프로세서, 그래픽저장장치(GPU) 등 엔비디아가 주도해온 영역으로 확장해나가고 있다.

1일 인텔은 2세대 하바나 ‘가우디2’ 딥러닝 프로세서와 엔비디아 ‘A100’의 AI 총 학습시간(TTT:Time to Train) 성능을 엠엘퍼프(MLPerf) 벤치마크에서 측정한 결과 가우디2 성능이 월등했다고 밝혔다.

엠엘퍼프는 삼성전자 구글 마이크로소프트 등 기업과 스탠퍼드 하버드 등 대학이 설립한 비영리단체 ML코먼스가 매년 개최하는 행사다. 사진 또는 영상에서 음성 인식 능력, 텍스트 이해 능력, 특정 물체 판별 능력 등 8개 분야에서 우위를 가린다.

가우디2는 인텔이 지난 2019년 인수한 하바나랩스가 만든 두 번째 AI 프로세서다. 인텔은 모빌아이 등 인수한 회사 제품 생산을 기존에 사용하던 반도체 수탁생산(파운드리) 업체를 유지하고 있다. 가우디2는 대만 TSMC가 생산한 것으로 추정된다.

이번 평가에서 가우디2는 비전 (ResNet-50) 및 언어(BERT) 부문에서 뛰어난 TTT를 기록한 것으로 전해진다.
산드라 리베라인텔 수석부사장 겸 데이터센터 및 AI 그룹 총괄은 “가우디2가 출시 한 달 만에 엠엘퍼프 벤치마크에서 뛰어난 성능을 기록해 기쁘다”며 “인텔은 비전 및 언어 모델 모두에서 동급 최고 성능을 제공해 고객에 가치를 제공하고 AI 딥러닝 솔루션 개발을 가속화하도록 지원할 것”이라고 말했다.

가우디2는 1세대 제품 대비 TTT 부문에서 큰 폭의 개선을 이뤄냈다. ResNet-50 모델의 경우 가우디2는 A100 대비 학습 시간이 36% 단축됐다. 델이 진행한 8개의 가속기 서버에서 진행한 ResNet-50 모델 및 BERT 모델 학습 테스트 결과 가우디2가 엔비디아 A100-40기가바이트(GB) 대비 학습 시간을 45% 단축했다.

가우디2는 가우디1 대비 ResNet-50 및 BERT 모델에서 각각 3배와 4.7배 높은 학습 처리량을 기록했다. 인텔은 해당 프로세서를 기존 16나노미터(nm) 공정에서 7nm 공정으로 전환해 텐서 프로세서 코어 수를 3배 증가했다. GEMM(General Matrix to Matrix Multiplication) 엔진 컴퓨팅 용량 증설, 패키지 내 고대역폭 메모리 용량 3배 확대, 대역폭 및 S램 크기 2배 확장 등을 통해 이번 성과를 달성했다.

한편 하바나는 슈퍼마이크로와 협력해 슈퍼마이크로 가우디2 학습 서버를 올해 3분기 출시할 예정이다.