[디지털데일리 백지영기자] “개발자와 데이터 분석가, 데이터 사이언티스트가 분석 업무에만 집중할 수 있도록 업무 효율을 개선한 인공지능(AI)/머신러닝(ML) 옵스 플랫폼을 제공합니다.”
엔터프라이즈 솔루션 기업인 효성인포메이션시스템은 4일 디지털데일리의 'DD튜브'를 통해 개최된 ‘AI 엔터프라이즈 버추얼 컨퍼런스’를 통해 기업이 AI 를 가장 비용 효율적으로 활용할 수 있는 최적의 IT 인프라 운영 전략으로 제시해 500여명 참가자들의 주목을 끌었다.
효성인포메이션의 김형섭 컨설턴트는 주제발표를 통해 “기존 IT 개발업무는 품질시스템에서 충분한 테스트를 거친 이후 운영 프로세스가 표준화돼 있는 반면, AI 머신러닝 업무 관련 운영 프로세스를 어떻게 적용해야 할지 고민에 빠져있다”며 “AI 머신러닝 도입 이후 운영 방안이 최근 기업의 주요 이슈로 떠오르고 있다”고 말했다.
현재 AI 머신러닝 업무는 개발자와 관리자의 영역으로 나눠진다. 여기서 말하는 개발자는 데이터 사이언티스트와 분석가, 엔지니어를 통칭한다. 개발자의 주요 역할은 빅데이터 AI 머린서닝을 활용해 도움을 얻을 수 있는 KPI에 대한 예측된 결과값을 도출해 수입을 창출하는 데 목적이 있다. 즉, 인프라나 개발 플랫폼보다는 분석에 집중해 효과적인 결과를 도출하는데 집중한다.
반면 IT관리자는 디지털 트랜스포메이션 환경이라고 불리는 AI 머신러닝 자원을 효율적으로 개발자에 제공하는 데 목적이 있다. 궁극적으로 개발자가 분석을 효과적으로 하는데 도움을 주는 역할을 하는 것이 관리자의 역할이다.
현재 AI 머신러닝 업무 프로세스는 데이터를 수집하고(마이닝) 전처리 수행한 이후 특정 통계기법 또는 알고리즘을 적용해 결과를 예측할 수 있는 모델을 만들고, 이 모델을 기준으로 운영에 적용할 수 있을지를 평가를 하는 과정이 반복적으로 일어난다.
그는 “이렇게 반복적으로 일어나는 과정 가운데 개발자는 인프라와 관련된 측면에 있어 GPU 리소스나 머신러닝 프레임워크와 관련된 환경에 대한 변경상의 요청을 하게 된다”며 “반복적으로 발생하는 요청을 어떻게 자동화시키고 줄일 수 있는지가 AI 머신러닝 플랫폼의 핵심”이라고 강조했다.
AI 분석 업무 프로세스가 효율적으로 되지 못하는 이유는 개발, 비용, 운영측면 등 다양하다. 개발 측면에선 AI 모델과 언어 환경이 다양하고, 개발 및 운영 프로세스가 비표준화돼 있기 때문이다. 비용적인 측면에서도 기업의 예산은 한정돼 있지만 많은 리소스를 사용자한테 제공해야 해 효율적인 자원 운영이 필요한 상황이다.
운영 측면에 있어서도 개발된 AI 모델을 어떻게 운영시스템에 반영을 할 것인지에 대한 기술적인 이해, 그리고 다양한 환경에서 개발된 모델의 효율적인 관리 이슈가 발생한다.
그는 “이같은 문제를 해결하기 위해선 개발과 관련해선 업무 협업 환경, 분석가가 독립적이거나 공동으로 작업할 수 있는 작업 공간이 필요하며 이는 컨테이너 기반 시스템이 적합하다”며 “또 업무 환경 측면에서 사전 정의된 분석 모형이라고 하는 템플릿화된 카탈로그를 시스템의 워크플로우 기반으로 업무 요청이 배포되는 환경이 필수”라고 설명했다.
비용 관련해선 클라우드와 ETL(데이터 추출·변환·적재), 데이터 레이크, 분석 플랫폼, GPU 가상화와 관련해 자원을 어떻게 효율적으로 쓸 수 있을지에 대한 해결이 필요하다. 운영 측면에선 AI/ML 옵스라고 불리는 정체 AI 머신러닝 플랫폼을 통합적으로 관리하는 것이 필요하다.
그는 “현재 효성인포메이션은 업무 협업과 자원의 비용 효율과 관련된 환경, AI/ML 옵스에 대한 환경을 통합적으로 제공한다”며 “이중 지원, 비용효율과 관련된 데이터 레이크의 경우, 국내에서 많이 활용되는 하둡 대신 오브젝트 스토리지를 제안하고 있다”고 말했다.
하둡에 저장되는 데이터 가운데 자주 사용되는 핫데이터 외에 덜 사용되는 콜드 데이터는 아카이빙을 통해 전체적인 비용을 낮출 수 있다는 설명이다. 저장 공간만 늘리고 싶을 경우, 오브젝트 스토리지 증설 비용만 증가돼 전체 데이터 레이크에 대한 비용을 절감할 수 있다는 설명이다.
또, 컨테이너 환경의 모델링을 운영에 적용시키고 이를 자동화하는 AI/ML 옵스 환경도 제공한다. 효성은 펜타호라는 오픈소스 플랫폼을 통해 데이터 저장제와 모델학습, 튜닝, 모델 배포 적용, 개선과 관련 자동화를 제공하는 것도 강점이다.
그는 “궁극적으로 효성은 AI 머신러닝 환경에서 반복적으로 발생하는 데이터 분석을 자동화시켜 데이터 분석가와 데이터 과학자가 분석업무에만 집중할 수 있도록 해 업무 환경을 개선시키는 플랫폼을 제공한다”고 말했다.
그는 이어 “이를 위해 분석 클라우드 환경과 자원효율 및 성능 개선을 제공하는 리모트 GPU, 오브젝트 스토리지를 통한 데이터 저장 효율 개선, AI/ML옵스를 효과적으로 관리하는 추출-처리-적재 등의 자동화 등을 유기적으로 조합한 전체 플랫폼을 원스톱으로 제공한다”고 강조했다.