KAIST는 이상엽 생명화학공학과 특훈교수 연구팀이 버나드 폴슨 미국 캘리포니아대 샌디에이고캠퍼스(UCSD) 생명공학과 교수와 AI를 활용해 미생물 유전자 기능 발견을 가속할 수 있는 최신 연구 접근법을 분석한 리뷰논문을 발표했다고 12일 밝혔다.
연구진의 증명사진.(왼쪽부터)이상엽 KAIST 특훈교수, 김기배 KAIST 박사, 버나드 폴슨 UCSD 교수.(사진=KAIST)
유전자 결실 실험, 발현량 조절, 시험관 내 활성 측정 등 다양한 실험도 시도했지만 대규모 실험의 한계부터 복잡한 생물학적 상호작용, 실험실 결과와 실제 생체 내 반응 간 불일치 문제로 유전자 기능 규명에는 여전히 많은 시간과 비용이 소요돼 왔다.
연구팀은 이러한 한계를 극복하기 위해 전산생물학과 실험생물학을 결합한 AI 기반 접근이 필수적이라고 강조했다.
이번 논문에서는 기존 서열 유사성 분석 기법부터 최신 심층학습 기반 AI 모델에 이르기까지, 유전자 기능 발견을 촉진해 온 전산생물학적 접근법을 정리했다.
특히 알파폴드(AlphaFold), 로제타폴드(RoseTTAFold)와 같은 단백질 3차원 구조 예측 기술이 단순한 기능 추정을 넘어 유전자 기능이 어떻게 작동하는지 이해할 수 있는 가능성을 제시했다. 생성형 AI도 원하는 기능을 가진 단백질을 설계하는 단계로까지 연구를 확장하고 있다.
연구팀은 전사인자(유전자를 켜고 끄는 스위치 역할을 하는 단백질)와 효소(생체 내 화학 반응을 촉진하는 단백질)를 중심으로 유전자 서열 정보, 단백질 구조 예측, 다양한 메타유전체 분석을 결합한 응용 사례와 연구 방향을 제시했다.
연구팀은 유전자 기능 발견의 편향과 한계를 극복하기 위해 AI가 실험을 안내하는 ‘능동적 학습(Active Learning)’ 기반 연구 프레임워크가 필요하다고 밝혔다.
능동적 학습은 AI 모델이 불확실성이 높은 예측을 스스로 선별해 실험을 제안하고, 그 결과를 다시 학습에 반영하는 방식이다. 이를 통해 연구자는 중요한 유전자 기능부터 효율적으로 검증할 수 있다.
또 자동화된 실험 플랫폼과 바이오파운드리 등 공유 연구 인프라와의 통합이 필수적이라고 강조했다. 또한 실험으로 검증되지 못한 ‘실패 데이터’도 향후 연구를 위한 중요한 학습 자산으로 공유돼야 한다고 덧붙였다.
이상엽 특훈교수는 “유전자 기능 발견의 한계를 넘어서려면 연구자의 지휘하에 AI가 안내하는 실험 프레임워크와 자동화 연구 인프라의 결합이 핵심”이라며 “예측과 검증이 반복적으로 연결되는 연구 생태계 구축이 중요하다”고 강조했다.
연구 결과는 생명공학 분야 국제 학술지 ‘네이처 마이크로볼로지(Nature Microbiology)’에 지난 7일자로 게재됐다.









