특이적 질병 유전자 발굴 및 맞춤 진단법 개발 기여 기대

대규모 동북아시아인 참조 유전체 데이터베이스가 구축되어 바이오 빅데이터 기반 의료산업에서 중요한 역할을 할 수 있을 것으로 기대된다.

분당서울대학교병원(정밀의료센터 서정선 석좌교수), 마크로젠(유승근∙김창욱∙김성재 연구원) 공동연구팀은 동북아시아 최대 규모의 동북아시아인 참조 유전체 데이터베이스(NARD)를 공개했다고 18일 밝혔다. 이번 연구 결과는 오픈 액세스 저널인 ‘유전체 의학' 온라인판에 10월 22일 자로 게재됐다.

동북아시아인 참조 유전체 데이터베이스에는 한국인 850명을 포함한 몽골인 384명, 일본인 396명, 중국인 91명, 홍콩인 58명 등 총 1,779명의 전장 유전체 분석(WGS) 정보와 유전변이 정보가 포함되어 있다. 이는 한국,  몽골, 일본, 중국 등 동북아시아 4개국을 대표할 수 있는 참조 유전체 데이터베이스 중 최대 규모이며, 현재까지 국내외에서 공개된 참조 유전체 데이터베이스 중 동북아시아인 유전체 분석에서 정확도를 크게 높일 수 있는 것으로 나타났다.

참조 유전체(Reference Database)는 수천 명에서 수만 명에 이르는 사람들의 전장 유전체 염기서열 정보로 구성된 데이터베이스로, 전장 유전체 연관성 분석(Genome-wide Association Study) 연구에서 사용된다. 그러나 동북아시아인을 위한 참조 유전체 데이터베이스는 턱없이 부족한 실정이다.

공동 연구팀은 이번에 구축한 동북아시아 최대 규모의 참조 유전체 데이터베이스가 참조 유전체를 활용해 유전변이 정보를 통계적으로 유추해 내는 결실값 예측기법의 정확도를 향상할 뿐만 아니라, 다중유전자위험점수(Polygenic Risk Score) 기반의 질병 예측에 중요한 역할을 할 것으로 예상하고 있다. 다중유전자위험점수는 2018년 MIT가 뽑은 10대 혁신기술 중 하나로, 결실값 예측기법을 통해 도출한 특정 질환에 영향을 미치는 수백 개 유전자의 위치 및 해당 질환의 위험성을 수치화하여 발병 위험을 예측하는 방법이다.

공동 연구팀은 이번 연구를 통해 동북아시아 4개국에서 각각 특이적으로 나타나는 유전체 특성이 있다는 것을 세계 최초로 규명했다고 밝혔다. 동북아시아인 참조 유전체 데이터베이스에 주성분 분석과 어드믹스쳐 분석을 진행한 결과, 한국인, 일본인, 중국인, 몽골인은 서로 다른 유전체 구성을 보였으며, 특히 한국인의 유전체 구성은 다른 동북아시아인의 유전체 구성과 뚜렷하게 구분되는 것으로 나타났다.  이는 동북아시아인과 같은 대륙별 인종뿐 아니라 국가별 인종에 대한 참조 유전체 구축이 필요함을 나타내며, 한국인에 대한 참조 유전체 데이터베이스의 필요성과 유의성을 과학적으로 입증한 중요한 결과라고 연구팀은 밝혔다.

 

 

저작권자 © 메디코파마 무단전재 및 재배포 금지