[디지털데일리 권하영 기자] kt cloud(대표 윤동식)는 슬라이싱 기술을 그래픽처리장치(GPU)에 적용한 인공지능(AI) 추론 전용 인프라 서비스 ‘AI SERV’를 출시했다고 16일 밝혔다.
AI SERV는 고성능 GPU 인프라를 각 서비스에 필요한 만큼만 분할하여 최적의 양을 사용할 수 있는 것이 특징이다. 비용 효율성뿐 아니라 성능과 호환성까지 갖췄다. AI 개발·학습을 마치고 AI 서비스를 제공 중인 AI 전문기업 또는 스타트업 등이 활용할 수 있다.
AI SERV에 적용된 슬라이싱 기술은 기존에 한 장으로 제공되던 GPU 서비스를 5분할해 0.2장 단위로 제공한다. 최소 사용 가능한 GPU 단위가 작아진 만큼 필요한 때 필요한 만큼의 인프라를 사용할 수 있어 가격 부담이 줄었고, 다양한 상황에 맞춰 탄력적이고 가변적인 활용이 가능하다는 설명이다.
kt cloud에 따르면 AI SERV는 타사의 유사 서비스 대비 성능 및 호환성 측면에서도 강점을 보인다. 엔비디아 A100 칩을 활용, 경쟁사의 최신 추론형 인프라 서비스와 비교해도 최소 두 배 빠른 연산 속도를 자랑한다. 엔비디아 쿠다(CUDA) 아키텍처 기반의 높은 호환성과 확장성도 강점이다.
kt cloud는 향후 AI SERV에 사용자의 손쉬운 인프라 확장 지원을 위한 모니터링 및 컨테이너 이미지 클로닝(Cloning) 기능 등을 추가하는 한편, 부하 발생시 인프라를 자동 확장시키는 ‘오토 스케일링’ 기능을 도입하는 등 서비스를 지속적으로 고도화해 나갈 계획이다.
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
[MWC25] SKT, 'K-AI 얼라이언스' 7개사 글로벌 진출 지원
2025-02-24 10:17:42"스터디그룹·선의의 경쟁 봤지?"…와이랩, 이제는 '넷플릭스'다
2025-02-23 16:48:11통신3사, MWC25서 'AI 각축전' 예고…유상임 장관 깜짝 회동할까
2025-02-23 14:57:14[OTT레이더] 인생을 건 머니게임이 시작됐다, 웨이브 ‘보물섬’
2025-02-23 12:04:50[인터뷰]“밤 9시까지 AI 열정!”...’KT에이블스쿨 전형’이 신설된 이유는?
2025-02-23 09:00:00연간 통신분쟁 전년 대비 22% 급증…”이용계약 관련 분쟁이 절반”
2025-02-21 17:39:30"3D 아바타 만나는 가상도시"…마와리, AI·XR 더한 '난바 프로젝트' 가동
2025-02-24 11:35:40넥슨 ‘던전앤파이터’, 중천으로 재도약… 바통은 ‘카잔’으로
2025-02-24 11:30:05"KTX 타면서 렌터카까지"…쏘카, 장거리 이동 트렌드 제시
2025-02-24 10:26:32데브시스터즈 ‘쿠키런: 브레이버스’, 7월11일 미국 출시
2025-02-24 10:19:17넥슨 ‘FC 온라인’, 이스포츠 대회 개편안 발표… 구단 프랜차이즈 도입
2025-02-24 09:29:13"스터디그룹·선의의 경쟁 봤지?"…와이랩, 이제는 '넷플릭스'다
2025-02-23 16:48:11