[디지털데일리 이상일기자] 데이터독과 서비스나우는 27일 <디지털데일리> 웨비나 플랫폼 ‘DD튜브’를 통해 ‘지능화, 자동화 기반 클라우드 운영 혁신 방안’을 주제로 발표에 나섰다.
데이터독은 클라우드 모니터링 기업으로 시작한 기술 기업으로 아마존, 구글, 마이크로소프트 클라우드 서비스에서 데이터독 플랫폼을 이용할 수 있다. 클라우드 서비스를 사용하면서 발생할 수 있는 여러 가지 문제점을 모두 해결할 수 있으며 보안, 최적화된 사용자 경험 제공 등에 강점을 가지고 있다.
서비스나우의 ‘하이퍼 AIOps’는 단일 클라우드 플랫폼으로써 신뢰할 수 있는 기준 정보를 기반으로 AI를 활용해 보다 빠른 이슈 대응과 선제적인 운영을 가능하게 한다.
데이터독 이노훈 아키텍트는 “데이터독은 온프레미스, 클라우드 환경을 모두 포함하는 모니터링 플랫폼으로 서비스를 구성하는 서버·데이터베이스·애플리케이션·네트워크 그리고 서드파티 솔루션 등에서 발생하는 데이터를 한 곳으로 수집해 기업 서비스에 대한 엔드투엔드 가시성을 제공한다”고 설명했다.
데이터독은 AWS, 마이크로소프트 애저, 구글 클라우드 플랫폼 등 글로벌 클라우드 사업자(CSP)과 손쉬운 연동을 위한 인티그레이션을 제공하며 클라우드 마이그레이션, 애플리케이션 현대화, 컨테이너 서비스 등의 다양한 프로젝트와 환경을 지원한다.
이노훈 아키텍트는 “데이터 독은 어떤 제품 혹은 작은 기능이 추가되더라도 모두 하나의 데이터 플랫폼에서 작동하고 또 기존 제품과의 연계를 가장 1순위로 생각하기 때문에 사용자들이 편하게 사용할 수 있다”고 밝혔다.
특히 데이터독은 최근의 복잡해지고 있는 IT인프라에 따라 시스템 가시성 확보가 화두가 되고 있는 가운데 강점을 가지고 있다는 설명이다.
이노훈 아키텍트는 “데이터독은 UX 모니터링이라 불리는 프론트 엔드 영역 모니터링이 가능할 뿐만 아니라 인프라, APM 등의 백엔드 모니터링, 그리고 전 영역을 아우르는 통합 로그 관리가 가능하다. 특히 이 모든 모니터링이 하나의 플랫폼, 하나의 화면에서 가능하다”며 “최종 고객부터 백엔드에 가장 깊은 종단까지 완벽한 엔드투엔드 가시성을 확보할 수 있고 심리스한 모니터링이 가능하게 된다”고 강조했다.
이어 발표에 나선 서비스나우 장순현 매니저는 “데이터독에서 감지된 장애 혹은 알람이 서비스나우와 연결돼 서비스 오퍼레이션 과정을 거쳐 근본원인을 분석하고 자동화된 조치를 취하는 과정을 거치게 된다. 이는 일반적인 AIOps를 넘어 AI를 활용해 운영과 서비스를 유기적으로 연계하고 있다는 의미”라고 강조했다.
서비스나우의 하이퍼 AIOps는 기준정보를 수집하고, 정제하고 로그분석을 통해 이상징후를 탐지, 장애를 예측하며 이벤트 관리를 통해서 중요한 알림(Alert)에 집중할 수 있도록 해준다.
특히 사고(인시던트)가 발생하면 장애의 근본원인을 분석하고 이에 대한 조치를 워크플로우를 통해 자동화해 처리하는 일련의 과정을 가능하게 한다.
장 매니저는 “서비스나우와 데이터독은 자원 정보 수집과 이벤트 수집에서 연동돼 데이타독에서 수집된 CI에 대한 정보가 서비스나우 CMDB에 업데이트되고 서비스나우의 서비스맵이 그려지게 된다”며 “데이타독에서 발생되는 이벤트 얼럿은 서비스나우의 CMDB와 매핑해 서비스나우 IT 서비스 관리를 통해서 인시던트를 생성한다. 결과적으로 비즈니스를 이해하는 CMDB를 기준으로 서비스 관리와 운영관리가 탄탄하게 연결되는 것”이라고 강조했다.
이렇게 관리된 CMDB는 대시보드와 리포트 형태로 관리자가 쉽게 현황을 파악하고 문제점을 확인할 수 있도록 한다. 서비스나우에서는 구성요소간의 관계를 기반으로 자동으로 관계 종속성 맵을 그리고 서비스와 비즈니스의 맥락을 이해할 수 있도록 서비스를 기준으로 서비스 맵을 제공한다.
이러한 기능을 통해 기업은 이슈가 발생되기 전, 사전 얼럿 및 조치를 통해 선제적인 예방 조치가 가능해진다는 설명이다.
한편 기업의 IT부서는 로그 뿐만 아니라 데이터 독과 기타 인프라 모니터링 툴을 통해서 들어오는 이벤트나 알람도 관리해야 한다. 서비스나우에서는 대량으로 들어오는 이벤트, 얼럿에 대해서 인공지능과 머신러닝을 활용해서 중복제거 및 노이즈를 제거하고 연관성 있는 얼럿을 그룹화해 CMDB에 있는 CI와 바인딩 해 인시던트를 자동으로 생성한다.
이 때 데이터독을 통해서 수집된 이벤트나, 로그 분석을 통해 감지된 이상 징후에 대해 자동으로 생성된 인시던트 티켓을 기반으로 머신러닝과 AI가 동작해 적절한 담당자를 배정하게 된다. 시스템 혹은 담당자가 수행하는 내역들은 불필요한 검토나 확인 과정이 필요하지 않도록 해 전체적으로 인시던트에 대한 해결 시간이 감소하게 되는 효과도 제공한다.
장 매니저는 “전체 서비스나우의 하이퍼 AIOps의 큰 틀 안에서 데이터독과의 연동을 통해 CI에 대한 정보와 구성도를 연결해서 서비스나우에 업데이트하면 기준 정보를 탐조해 로그 분석을 통한 이상징후 탐지와 장애를 예측하고 데이터독에서 발생된 이벤트는 서비스나우의 IT 서비스관리와 연동되어 자동화와 최적화의 영역에서 인시던트를 생성하고 근본원인을 분석하고, 자동화된 조치를 취하게 된다”고 강조했다.