[디지털데일리 백지영기자] 머신러닝과 딥러닝 등 인공지능(AI) 워크로드에 특화돼 있는 GPU(그래픽처리장치) 클라우드가 최근 빠른 속도로 늘어나고 있다. 전력 대비 성능이 우수한 GPU는 퍼블릭 클라우드에서의 활용도가 높아지고 있지만 비용 부담이 여전히 높은 편이다. 때문에 프라이빗 클라우드 환경에서의 자체적인 AI 워크로드 구현도 최근 많아지고 있다.
과학기술정보통신부 주최, 정보통신산업진흥원(NIPA)·디지털데일리가 공동 주관으로 개최한 ‘오픈 테크넷 서밋 2021 버추얼 컨퍼런스’ 둘째날 신정규 래블업 대표는 “AI나 딥러닝 워크로드를 퍼블릭 클라우드 상의 GPU에서 돌렸을 때의 비용이 자체적으로 구축했을 때보다 아직 상당히 높은 것이 현실”이라며 “또, 일부 워크로드는 여전히 퍼블릭 클라우드에 올릴 수 없기 때문에 프라이빗 클라우드 구축 수요가 많다”고 말했다.
예를 들어 헬스케어와 같은 의료, 개인정보에 민감한 금융정보 등은 퍼블릭 클라우드에 올리기 어렵다. 또, 자체적으로 매우 특이한 기술을 개발하고 있거나 데이터의 양이 너무나 커서 엔드포인트의 노출 우려가 있을 경우, 국방 분야도 퍼블릭 클라우드 활용을 지양한다. 퍼블릭 클라우드에 올라간 워크로드도 다양한 이유로 프라이빗 클라우드로 회귀하는 경우가 많다.
여기서 말하는 프라이빗 클라우드는 자체적으로 ‘클라우드 같은’ 온프레미스 클러스터를 운영하는 것을 뜻한다. 기존 온프레미스 인프라와의 차이점은 ‘확장성’이다. 최근 퍼블릭 클라우드 서비스 사업자들도 ‘AWS 아웃포스트’나 ‘구글 클라우드 안토스’, ‘MS 애저 스택’ 같은 프라이빗 클라우드 서비스를 제공하고 있다.
신정규 대표가 지난 2015년 설립한 래블업은 ‘백엔드닷에이아이(Backend.AI)’라는 플랫폼을 제공하는 AI 스타트업이다. 백엔드닷에이아이는 머신러닝이나 딥러닝 모델을 훈련하고 실행하는 모든 과정을 클라우드 또는 자신의 서버에서 쉽고 빠르게 구동시켜주는 플랫폼이다. 한마디로 정의하면 ‘AI 프레임워크용 엔터프라이즈 클러스터 백엔드 플랫폼’이라고 할 수 있다.
주요 특징은 GPU를 가상화해서 여러 명이 하나의 GPU를 효율적으로 나눠쓸 수 있게 지원하고, 쉬운 GUI와 강력한 CLI 및 SDK를 제공하는 것이다. 이를 통해 관리 편의성과 사용율을 높여준다.
그는 “프라이빗 클라우드에서 AI 워크로드를 구동하는 것은 쉽지 않다”며 “특히 많은 오픈소스가 가상화 기반으로 컨테이너 기반 마이크로서비스아키텍처(MSA)로 변화하고 있고, 패키지 저장소도 온라인을 통해 배포되고 있어 인터넷 연결이 안되는 환경에선 사용하기 어렵다”고 지적했다.
편의성과 보안을 교환해야 하는 문제도 있다. 최근 전세계적으로 개인정보보호 관련 법률이나 규정이 강화되고, 네트워크 및 스토리지 요소는 더욱 복잡해지고 있다. 보안을 강화할수록 외부와 완전히 차단된 클라우드를 구축해야 하기 때문에 인터넷 연결이 안되고 이는 불편함을 가중시킨다.
시장 요구와 아키텍처도 갈수록 복잡해지고 있다. 그는 “머신러닝과 딥러닝과 빅데이터를 결합하며 데이터 중심의 IT 서비스로 변화하고 있는데 그 과정에서 굉장히 다양한 종류의 클라우드 요구 사항이 일어나고 있다”며 “예를 들어 빠른 데이터 접근 및 처리를 위해 네트워크부터 GPU까지의 파이프라인 최적화라든지 대규모 DB 분석이나 AI 맞춤형 제공 등 여러 문제가 발생한다”고 말했다.
궁극적으로 래블업은 프라이빗 클라우드에서 AI 워크로드를 쉽게 돌릴 수 있는 방안으로 오는 11월 백엔드닷에이이용 로컬 패키지 저장소 서비스인 ‘백에드닷에이아이 레저버(Reservior)’의 공식 출시를 앞두고 있다. 이는 크게 패키지 허브서비스와 프라이빗 클라우드 2가지 서비스로 구성돼 있다. 현재 백엔드닷에이아이 엔터프라이즈의 추가 컴포넌트 형태로 제공된다.
그는 “관련 프로젝트를 내부적으로 시작한지는 약 3년 정도 됐고 고객에게 실제 공급된 것은 작년 중순(6월)부터”라며 “보안체크를 거친 패키지와 오픈소스 라이선스 확인 파이프라인을 제공하기 때문에 프라이빗 클라우드나 폐쇄 환경, 오프라인 사이트에 최적인 솔루션”이라고 강조했다.
또, 래블업 저장소 허브와의 주기적 동기화로 통해 최신 상태를 유지할 수 있는 것도 강점이다. 실제 한 기업은 자체 보유한 보안 기술을 사용해 고객 사이트에서 추가 보안 검토가 이뤄져야 사이트 내로 반입이 가능해야 하는 구조였다. 고객사 내 백엔드닷에이아이 세션 및 윈도 개발 PC에서 레저버 저장소를 사용해 자동 업데이트 파이프라인을 구축할 수 있었다.
신 대표는 “레저버는 사실 내부적으로 프라이빗 클라우드와 컨테이너, AI를 통합했을 때 생기는 여러가지 문제점과 이를 해결하기 위해 만든 오픈소스 엔터프라이즈 서비스”라며 “오는 11월 공개될 레저버 서비스를 통해 다양한 종류의 퍼블릭 클라우드 뿐 아니라 이제 퍼블릭 클라우드의 자율성을 프라이빗 클라우드에서도 구현하실 수 있기를 바란다”고 말했다.