[디지털데일리 백지영기자] 데이터 분석과 AI 활용 등을 위한 핵심 자원으로 비정형 데이터의 중요성이 커지고 있다. 이에 따라 기업들은 이를 효과적으로 저장하고 관리하는 방안에 대한 관심이 높아지고 있다.
비정형 데이터 세트는 하둡, 머신러닝, 딥 러닝의 부상과 함께 폭발적으로 증가하고 있다. 특히 서로 다른 여러 클라우드를 사용하는 멀티 클라우드 시대를 맞아 데이터의 유형이나 위치 또한 다양해지고 있는 상황이다.
이런 시장의 수요에 즉시 부합한 혁신적인 솔루션이 스케일아웃 스토리지 솔루션과 ‘델 EMC 파워엣지 서버’를 결합한 ‘델 EMC 파워스케일’이다. 중앙집중식 데이터센터 뿐 아니라 퍼블릭 클라우드와 엣지 환경에서까지 파일 및 오브젝트 데이터 관리 기반을 제공하는 제품이다.
인텔 테크놀로지 기반으로 15년 이상 개발돼 온 안정적인 9세대 원FS 운영체제를 일반적인 파일 서비스(NFS/SMB)와 더불어 하둡, 인공지능(AI/ML/DL), 오브젝트(S3) 및 REST API 기반의 애플리케이션을 지원한다.
최소 11TB에서 최대 60PB까지 확장이 가능하며, 수백만 개의 파일 작업을 수행해도 갑작스런 시스템 중단이나 비용 소모적인 다운타임이 발생하지 않는다. 또한 단 60초만에 ‘델 EMC 파워스케일’ 혹은 기존의 ‘아이실론’ 클러스터에 노드를 추가해 용량은 물론 성능까지 선형적으로 증가시킬 수 있다. 기업 및 조직에서는 수요에 맞는 적절한 증설 범위를 쉽게 예측할 수 있어 효율적인 확장이 가능하다.
무엇보다 파워스케일이 제공하는 확장성의 핵심은 단일 파일시스템인 ‘원FS’로 하나의 네임스페이스를 가졌다. 모든 데이터 및 메타데이터는 중복성과 가용성을 위해서 노드 전체에 자동으로 분산 저장된다.
단일 네임스페이스만을 지원하는 여타 아키텍처와는 달리 원FS는 단일 파일 시스템을 통해 볼륨 관리와 개별 노드 관리가 모두 일원화된다. 용량이 확장되더라도 관리 지점이 증가하지 않는다.
자동으로 데이터를 전체 노드로 균등하게 분산함으로써 스토리지 전체 자원을 최적화하는 오토밸런스 기능도 특징이다. 데이터 이관 없이 스토리지 노드를 추가 혹은 제거하는 등 재구성 작업 및 전체 노드 변경도 가능하다. 비용 효율성을 위해 자동 계층화를 제공, 정책에 따라 자동으로 적용돼 관리자의 개입을 최소화할 수 있다.
가용성 측면에서도 전통적인 레이드(RAID) 방식의 보호 기법이 아닌 이레이저 코딩 기법의 데이터 보호 기능을 채택했다. 물리적인 레이드 그룹에 의존하지 않고 전체 클러스터에 구성된 데이터 풀 내에서 보호 기능이 작동한다. 최대 4개의 노드에 장애가 발생해도 서비스 연속성을 보장한다. 특히 보호 수준을 클러스터가 아닌 디렉토리 및 파일 수준으로 세분화해 적용할 수 있어 중요한 데이터를 보다 확실하게 보호할 수 있다.
장애 복구 과정 역시 별도의 보조 디스크나 노드 없이 여유 공간을 활용한다. 만약 특정 노드에 장애가 발생하면, 해당 노드의 데이터는 다른 노드의 가용 공간으로 자동으로 옮겨져 재구성되어 서비스가 정상적으로 유지된다. 장애가 난 노드를 수리하거나 교체하면, 오토밸런스 기능이 다시 데이터를 자동으로 분산 복구하기 때문에 미션 크리티컬 애플리케이션이라도 해도 안전하게 활용할 수 있다.
이밖에 NFS, SMB, S3, HTTP, FTP, HDFS 등 광범위한 업계 표준 프로토콜을 통합 지원하며, 모든 사용자 간에 공유되는 글로벌 권한 구조를 갖추고 있다. 특히 빅데이터 환경의 표준으로 자리 잡은 하둡의 경우, 네이티브 HDFS를 지원해 플러그인이나 에이전트 등의 추가 설정 없이 바로 사용할 수 있다.
‘파워스케일’ 스토리지와 함께 제공되는 소프트웨어는 인프라와 데이터에 대한 인사이트를 제공해 관리의 효율성을 극대화한다. ‘델 EMC 데이터IQ’는 파워스케일 이외에 이기종 스토리지 시스템 전반에서 비정형 데이터를 검색 및 분류하고 배치할 수 있다.
여러 플랫폼을 통한 빠른 인덱싱이 용이하고 사일로화된 데이터를 관리할 수 있으며, 이 모든 것들을 단일 뷰를 통한 직관적인 UI를 통해 관리할 수 있다. ‘델 EMC 클라우드IQ’는 스토리지 상태 모니터링, 인사이트 및 분석 정보를 제공해 스토리지 환경을 쉽게 모니터링 및 분석하고 문제를 해결하도록 지원한다.