[디지털데일리 신제인 기자] 바이오 및 의료분야 산업의 효율성을 획기적으로 높일 수 있는 성과가 나왔다.
국내 연구진이 국가슈퍼컴퓨터 5호기 '누리온'을 이용해 질병과 관련된 유전자를 찾는 데 소요되는 시간을 대폭 줄였다. 또한 슈퍼컴퓨터를 이용해 방대한 양의 유전자 데이터를 다루며 통계적 오류까지 보완할 수 있게 됐다.
한국과학기술정보연구원(KISTI)은 가천대 의대 연구팀과 함께 국가 슈퍼컴퓨터 5호기 누리온으로 전장유전체 연관분석(GWAS)을 수행하고, 이를 위한 소프트웨어(SW)를 개발했다고 31일 밝혔다.
전장유전체 연관분석은 생물의 외형상 특징과 다양한 유전적 변이 간의 통계적인 연관성을 분석하는 방법이다. 질병의 원인이 되는 유전자 발굴뿐만 아니라 개인 맞춤형 건강 관리나 농축산 분야의 신품종 개량을 위해서도 널리 사용되고 있다.
다만 방대한 양의 데이터를 처리하는 과정에서 기존 컴퓨터로는 오류의 한계를 감수해야만 했다. 전체 데이터 중 일부만 실제로 계산하고 나머지 데이터는 통계적 보완 방식으로 처리해야 했기 때문이다.
한국과학기술정보연구원의 권오경 책임연구원과 백효정 선임연구원은 누리온의 최대 2500노드를 동시에 사용하는 방식으로, 전장유전체 연관분석 속도를 기존대비 4배 이상 높이고 오류를 보정하는 방법을 고안해냈다.
연구팀은 전장유전체 연관분석을 슈퍼컴퓨터에서 수행하기 위해 별도의 소프트웨어(MPI-GWAS)도 함께 개발했다.
이를 통해 한국인 7523명과 영국인 4242명의 8만4295개 유전자 변이 중 당뇨, 고혈압과 연관된 유전자 변이를 전장유전체 연관분석을 통해 도출하고, 최대 70억 회의 무작위 조합을 통해 통계상 나타나는 오류도 보정할 수 있었다.
관련 연구 내용은 ‘전장유전체 연관분석을 위한 슈퍼컴퓨팅 병렬화 (MPI-GWAS: a supercomputing aided permutation approach for genome-wide association studies)’라는 논문 제목으로 국제 학술지인 ‘유전체학과 정보학(Genomics & Informatics)’에 실렸다.
권 책임연구원은 “이전에 해외에서 수백노드를 사용해 전장유전체 연관분석을 수행한 경우는 있었지만 2500노드를 동시에 사용한 건 처음”이라며 “물리적 한계로 계산하지 못했던 것들을 슈퍼컴퓨터를 통해 계산할 수 있게 됐다는 데 의의가 있다”고 평가했다.
그러면서 “이번에 개발한 소프트웨어의 소스코드를 코드 공유 플랫폼인 깃허브에 공개해 다양한 유전체 연구자들이 자유롭게 활용할 수 있도록 했다”며 “유전체 분야에 슈퍼컴퓨터를 활용한 연구 효율화를 기대한다”고 덧붙였다.