▲ 병리과 성창옥 교수(오른쪽)와 오지혜 박사.
BI는 ‘bioinformatics(생명정보학)’의 약자로 생물학, 컴퓨터 과학, 수리통계학 등을 모두 다루는 광범위한 분야다. 올해 3월 융합연구지원센터에 설립된 BI 코어에서는 유전체 데이터 분석을 통해 생명현상을 이해하고, 질병의 발생기전 및 치료 단서를 찾아내기 위한 연구를 진행하고 있다. 연구자들이 최고의 결과를 도출할 수 있도록 지원하고 있는 BI 코어를 소개한다.
유전체 데이터는 차세대 시퀀싱 방법을 통해 얻어진다. ▲전장/엑솜 시퀀싱(whole genome/exome sequencing) ▲전사체 시퀀싱(RNA sequencing) ▲단일세포 시퀀싱(single cell) ▲칩(ChIP) 시퀀싱 등 여러 종류가 있으며, 각각의 방법에 따라 확인할 수 있는 유전체 정보나 분석 방법이 달라진다.
유전체 데이터는 방대한 정보를 가지고 있고 파일 용량이 매우 크기 때문에 사람의 눈으로는 확인할 수 없다. 따라서 대부분 리눅스 서버를 이용한 컴퓨터 작업을 통해 이뤄진다. BI 코어에서는 컴퓨터 작업을 위한 분석 파이프라인을 개발해 유전체 데이터에 적용하고, 방대한 데이터 속에 숨겨져 있는 의미 있는 정보를 도출하는 일을 한다. 이렇게 일차적으로 확인된 정보 역시 매우 방대한 양의 숫자나 문자의 또다른 조합이기 때문에 이에 대한 2차 분석과 직관적으로 바라볼 수 있는 시각화 작업도 함께 진행한다.
BI 코어에서는 병리과 성창옥 교수와 컴퓨터·생명과학을 전공한 오지혜 박사가 협업해 환자와 연구자에게 도움이 되고자 하는 마음으로 유전체 데이터 분석에 힘쓰고 있다.
▲ (좌) 오지혜 박사가 유전체 데이터 분석을 수행하고 있는 모습. / (우) 성창옥 교수와 오지혜 박사(왼쪽부터)가 분석용 서버 컴퓨터를 점검하고 있는 모습.
Q. BI 코어의 설립 배경은
차세대 시퀀싱 데이터를 비롯해 각종 의료정보와 데이터들이 축적되면서 수작업으로는 점차 다루기 어려워지고 있다. 특히 차세대 시퀀싱은 연구와 임상에서 보편적으로 사용되고 있지만, 단 1례에서 얻은 샘플이라도 분석에는 동일한 컴퓨터 작업이 필요하기 때문에 이 분야의 전문적인 지식이 없으면 처리하기가 어렵다. 이럴 때 도움을 줄 수 있도록 만들어진 게 BI 코어다.
Q. BI 코어의 경쟁력은
거의 모든 형태의 유전체 데이터를 분석할 수 있다. 연구자들이 가지고 있는 유전체 데이터 분석을 통해 알고 싶은 결과나 의미 있는 소견을 발굴하고 시각화에 도움을 줄 수 있다. 또한 데이터 분석 방향이나 연구 디자인에 대한 조언도 가능하다. 질병에 대한 이해와 컴퓨터, 생명과학에 대한 전문성을 바탕으로 그동안 유전체 데이터 분석과 관련한 다수의 저명 저널에 출판을 해오고 있다.
Q. 한계와 발전 방향은
각각의 연구디자인, 목적, 데이터 형태에 따라 그에 맞는 코딩을 해서 작업을 해야 하고 사람이 데이터를 계속 들여다 봐야 하기 때문에 처리할 수 있는 건수에 제한이 있는 점이 아쉽다. 최선의 결과를 도출하기 위해 노력하고 있지만 시간에 쫓겨 연구자들에게 더욱 양질의 결과물을 줄 수 없을 때 괴로움을 느끼기도 한다. 지금은 유전체 데이터를 주로 다루지만 향후 대사체, 단백체 등 다른 오믹스 데이터와 통합 분석할 수 있는 여건이 마련돼야 한다. 또한 Hi-C/5C로 대표되는 3D 지노믹스에 대한 분석도 확대할 계획이다. 데이터 분석 경향이나 유전체 플랫폼이 계속해서 바뀌고 있기 때문에 향후 미래 환자 치료의 방향성을 읽어서 뒤처지지 않게 대응할 수 있도록 노력하려 한다.
BI코어
•책임교수 : 병리과 성창옥 교수
•담당연구원 : 병리과 오지혜 박사
•위치 : 융합연구관 11층
•연구 지원 서비스
- 차세대 시퀀싱(NGS) 데이터 분석
- 공동연구 및 교육 지원
- 연구과제 지원(유전체 연구 설계, 전략 및 시퀀싱 소요 비용 상담)