이인석 교수팀, AI로 ‘숨은 미생물 유전체’ 더 정확하게 복원한다

메타지놈 분석 최적 전략 제시… 기존 대비 30% 이상 성능 향상
  • 2026.04.21
제품이미지

[사진. (왼쪽부터) 생명공학과 이인석 교수, 김정연 박사과정생]

 

생명공학과 이인석 교수 연구팀이 배양이 어려운 미생물의 유전체를 보다 정확하게 복원할 수 있는 인공지능(AI) 기반 메타지놈 분석의 최적 전략을 제시했다.

 

이번 연구는 다양한 최신 분석 도구들을 대규모로 비교·검증해 실제 연구 환경에서 가장 효과적인 분석 조건을 체계적으로 제시했다는 점에서 의미가 크다. 특히 연구팀이 제안한 통합 분석 전략을 적용할 경우 기존 방법 대비 30% 이상 많은 고품질 미생물 유전체를 확보할 수 있는 것으로 나타났다.

 

마이크로바이옴 연구에서는 사람의 장, 구강, 그리고 환경에 존재하는 수많은 미생물 가운데 실험실에서 배양이 어려운 ‘난배양성 미생물’의 유전체를 복원하는 것이 핵심 과제로 꼽힌다. 이러한 유전체 정보는 미생물의 기능과 질환 연관성을 밝히는 데 필수적이지만, 실제 메타지놈 데이터는 서로 다른 미생물의 DNA가 복잡하게 섞여 있어 정확한 복원이 쉽지 않다.

 

최근 딥러닝 기반 인공지능 기술이 메타지놈 분석에 빠르게 도입되고 있으나, 다양한 도구들이 혼재된 상황에서 어떤 조건에서 어떤 방법이 가장 효과적인지에 대한 기준은 부족했다.

 

연구팀은 이러한 문제를 해결하기 위해 최신 메타지놈 유전체 복원 도구 9종과 후처리 전략 3종을 대상으로, 모의 데이터와 실제 데이터를 활용한 대규모 비교 분석을 수행했다. 이 과정에서 시퀀싱 깊이, 미생물 군집의 복잡도, 샘플 수, 시퀀싱 방식 등 실제 연구 성능에 영향을 미치는 핵심 요인을 종합적으로 평가했다.

제품이미지

[그림. 연구팀이 제안한 최적화 분석 전략 적용 시 기존 대비 30% 이상 향상된 고품질 미생물 유전체 확보 결과]

 

그 결과, 인공지능 기반 최신 도구들이 기존 전통적 방법보다 전반적으로 우수한 성능을 보였으며, 특히 미생물 군집이 복잡하거나 데이터가 제한된 조건에서 강점을 나타냈다. 이는 인공지능 기술이 고난도의 메타지놈 데이터 해석 문제 해결에 실질적으로 기여할 수 있음을 보여준다.

 

또한 연구팀은 단순히 더 많은 유전체를 복원하는 것을 넘어, 잘못 연결된 유전체 조각(키메라) 문제까지 분석함으로써 ‘복원 정확도’의 중요성을 함께 제시했다. 이는 향후 미생물 유전체 데이터베이스 구축의 품질 기준을 높이는 데 중요한 기준이 될 것으로 기대된다.

 

아울러 다중 샘플 분석의 최적 조건도 규명됐다. 여러 샘플을 함께 분석할 경우 성능이 향상되지만, 그 효과는 무한정 증가하지 않으며 약 20개 내외의 샘플에서 가장 높은 효율을 보였다. 또한 paired-end sequencing은 복원 정확도를 크게 향상시키는 반면, single-end sequencing은 분석 성능을 전반적으로 저하시켰다.

 

연구팀은 이러한 결과를 바탕으로 여러 최신 도구의 장점을 결합한 통합 분석 파이프라인을 제안했으며, 이 전략은 장내, 구강, 환경 등 다양한 마이크로바이옴 환경에서 일관되게 우수한 성능을 보였다.

 

이인석 교수는 “마이크로바이옴 연구의 핵심은 배양이 어려운 미생물의 유전체를 얼마나 정확하게 복원하느냐에 있다”며 “이번 연구는 인공지능 기반 분석 기술의 실제 성능을 객관적으로 검증하고, 연구자들이 상황에 맞는 최적 전략을 선택할 수 있도록 실용적인 기준을 제시했다는 점에서 의미가 있다”고 밝혔다.

 

이어 “이번 성과는 정밀한 마이크로바이옴 유전체 지도 구축과 질환 연관 미생물 연구, 나아가 차세대 인공지능 기반 미생물 분석 기술 발전의 기반이 될 것”이라고 덧붙였다.

 

한편, 이번 연구는 한국연구재단 중견연구자지원사업, 구강마이크로바이옴 연구센터(K-OMRC), 바이오센테니얼융합연구원(BCCI)의 지원을 받아 수행됐으며, 연구 결과는 국제학술지 Nature Communications에 4월 14일 온라인 게재됐다. 연구에는 생명공학과 김정연 박사과정생이 제1 저자로 참여했다.


논문정보