광주과학기술원(GIST)은 남호정 전기전자컴퓨터공학과 교수 연구팀이 암 환자의 유전자형을 분석해 개인 맞춤형 항암제 후보물질을 제안하는 생성형 인공지능(AI) 모델을 개발했다고 3일 밝혔다.
연구팀이 개발한 AI 모델은 암세포마다 다르게 나타나는 유전자형 정보와 약물 반응 데이터를 학습해 환자 개인에게 최적화된 새로운 항암제 후보물질을 생성할 수 있다. 이로써 환자 맞춤형 정밀의료는 물론 기존의 치료법이 잘 듣기 않는 난치성 암에 대한 새로운 해법을 제시할 수 있게 됐다.
지금까지의 생성형 AI 기반 항암제 개발 연구에 대해 암과 같은 복합 질환에서는 치료 표적이 불분명한 경우가 많아 생성된 약물의 효과가 제한적이었고 임상 현장에서 확보하기 어려운 특수한 데이터에 의존하는 경우가 많아 실제 활용 가능성이 낮았다고 설명했다.
연구팀은 이러한 한계를 극복하기 위해 약 150만 개의 화학 구조와 120만 건의 약물 반응 데이터를 학습한 생성형 AI 모델 ‘G2D-Diff’를 개발했다. 이 모델은 실제 임상에서 확보할 수 있는 유전자 정보(돌연변이 및 복제수 변이)와 목표로 하는 약물 반응 수준을 입력하 이에 최적화된 항암제 후보물질을 자동으로 설계한다.
G2D-Diff는 텍스트-이미지를 생성하는 AI 모델과 유사한 방식으로 작동한다. 예를 들어 ‘특정 암 유전자형에 매우 민감한* 약물’이라는 조건을 입력하면, 그 조건에 맞는 항암제 분자 구조를 생성하는 것이다.
이 모델은 △분자구조를 수치로 표현하는 ‘화학적 변분 오토인코더’ △입력 조건(유전자형과 약물 반응 목표 등)을 수치화하는 ‘조건 인코더’ △조건에 맞는 새로운 분자 구조를 생성하는 ‘조건부 확산 모델’로 구성되어 있다.
G2D-Diff는 기존 생성형 AI 모델들에 비해 모든 성능 지표에서 압도적인 성능을 보였다. 특히 최고 성능을 가진 모델로 알려진 IBM의‘PaccMannRL*’과 비교했을 때, 다양성, 실현 가능성, 조건 적합성 등에서 모두 우수한 성능을 나타냈다.
생성된 화합물들이 입력된 유전자형 조건에 얼마나 잘 부합하는지 평가하는 ‘조건 적합성 항목 중 약물 반응성 예측에서는 기존 모델이 약 51%의 평균 오차율을 보인 반면, G2D-Diff는 약 1% 수준의 평균 오차율을 기록했다.
또한 생성된 분자 구조는 약물 유사성 및 합성 접근성 측면에서 실제 약물군들과의 분포 유사성이 기존 모델보다 평균 35~44% 더 높게 나타났다.
연구팀은 G2D-Diff 모델을 난치성 암의 대표 사례인 삼중-음성 유방암에 적용해 실제 활용 가능성을 검증했다.
남호정 GIST 교수는 “이번 연구는 개인 맞춤형 의학의 새로운 가능성을 연 것으로 AI 기술이 난치성 암 환자들에게 새로운 희망을 제공할 수 있을 것으로 기대한다”고 말했다.
김현호 박사과정(국가독성과학연구소 선임연구원)은 “G2D-Diff는 신약 개발 과정에서 가장 어려운 초기 후보물질 탐색 단계의 효율성을 비약적으로 향상시킬 수 있어 항암제 개발 기간을 크게 단축할 수 있을 것”이라고 했다.
연구 결과는 국제학술지네이처 커뮤니케이션즈(Nature Communications)에 지난 1일 온라인 게재됐다.