[창간 5주년 특집] 이승빈 마크로젠 CSO “30억 개 유전자, AI가 읽고 정밀의학이 답한다”
유전체 데이터, 개인 건강 관리하는 핵심 도구로 확장 AI 기반 분석부터 생성형 AI 챗봇까지… 변화 이끄는 기술 접목 아시아인 유전체 데이터 축적해 글로벌 정밀의료 시장서 차별화
[편집자 주] 조선미디어그룹이 설립한 인공지능 전문매체, ‘더에이아이(THE AI)’가 창간 5주년을 맞이했습니다. THE AI는 생성형 AI 열풍이 불기 전부터, AI 가능성과 한계를 탐구하며 깊이 있는 취재와 분석을 이어왔습니다. 이번 5주년 특집에서는 국내외 AI 석학 및 전문가들과의 인터뷰를 통해 AI 기술의 현재와 미래를 조망합니다. AI 혁명의 최전선에 서 있는 여러 전문가의 통찰과 비전을 독자 여러분께 전합니다. 많은 관심과 성원 부탁드립니다.
“유전체 정보도 혈당 수치처럼 누구나 쉽게 확인하고 관리하는 시대가 오고 있습니다.”
마크로젠 이승빈 최고과학책임자(CSO)의 말이다. 과거 연구자들만 다루던 유전체 데이터가 이제는 개인 건강을 관리하는 핵심 도구로 확장하고 있다. 약 30억 개의 염기쌍으로 구성된 인간의 유전자를 분석해 질병 위험을 예측하고, 생활 습관을 바꾸며, 더 나아가 맞춤형 치료로 이어지는 시대가 다가오고 있는 것이다.
여기서 중요한 것은 다양한 유전체 데이터 보유 여부다. 최근 글로벌 유전체 분석 시장은 전환점을 맞고 있다. 오랜 기간 백인 중심으로 축적된 유전체 데이터가 다양한 인종을 대표하지 못한다는 인식이 확산하면서, 아시아인의 유전적 특성을 반영한 데이터 확보가 곧 정밀 의료의 핵심 경쟁력으로 떠오르고 있다. 이승빈 CSO는 “앞으로는 누가 더 정확하고 풍부한 아시아인 유전체 데이터를 보유하느냐가 시장 경쟁의 핵심이 될 것”이라고 강조했다.
마크로젠은 이러한 흐름에 선제적으로 대응해 온 기업이다. ‘게놈아시아 100K’, ‘AK1’, ‘NARD’ 등 아시아인 중심 유전체 데이터를 생산하고 분석한 경험은 세계 시장에서 마크로젠을 유리한 위치에 올려놨다. 최근에는 ‘국가 통합 바이오 빅데이터 구축 사업’ 주관사로 선정되며 기술력과 신뢰성을 다시 한번 입증했다.
인공지능(AI) 기술 역시 마크로젠의 핵심 무기다. 회사는 현재 DeepVariant, PyPGx 같은 AI 기반 유전자 변이 분석 도구를 사용해 희귀질환 진단, 약물 반응 예측, 암 유전체 해석 등에서 정밀도를 높이고 있다. 실험 실패를 사전에 예측하는 품질 관리 AI, 수십만 건의 수주 데이터를 분석해 영업 전략을 짜는 생성형 AI 모델을 활용하고 있고, 일반 소비자를 대상으로 한 유전자 검사 플랫폼 ‘젠톡(GenTok)’에도 생성형 AI 기술을 적용, 누구나 쉽게 자신의 유전 정보에 기반한 건강 조언을 얻을 수 있게 했다.
이승빈 CSO는 “마크로젠은 이제 ‘유전자 분석 기업’을 넘어, ‘정밀의학 정보 기업’으로의 전환을 준비하고 있다”고 밝혔다. 유전체 데이터와 AI의 결합이 의료의 판을 어떻게 바꾸고 있는지, 그와 자세한 이야기를 나눴다.
- 마크로젠 현재 유전체 분석 관련 주력하는 연구와 기술은 무엇인가.
“우리는 개인 유전정보를 바탕으로 질병을 예측하고 예방하는 정밀의학 실현을 목표로 한다. 이를 위해 최신 기술을 빠르게 도입하고, 차별화된 서비스를 만들기 위해 노력하고 있다. 연구 분야를 보면, 사람의 유전체(유전정보 전체), 유전자 발현 정보, 유전자에 영향을 주는 외부 요인, 단백질 정보, 그리고 하나하나의 세포 정보를 분석하는 작업 등을 하고 있다. 이렇게 얻은 데이터를 바탕으로, 질병 예측이나 맞춤형 치료에 도움이 되는 분석 결과를 제공한다. 이를 실현하기 위해, 정밀한 유전체 분석 기술과 다양한 생명정보 분석 기법을 함께 활용하고 있다.”
- 유전체 분석 기술 중 ‘단일세포 분석(single-cell sequencing)’이나 ‘장기 읽기(long-read sequencing)’ 등 최신 기술도 연구에 포함되나.
“맞다. 마크로젠은 최신 유전체 분석 기술인 long-read sequencing과 single-cell sequencing 모두에서 활발히 연구하고 서비스를 제공하고 있다. Long-read 기술은 기존보다 더 긴 DNA 조각을 한 번에 읽을 수 있어, 기존 방식으로는 알아내기 어려웠던 유전체의 복잡한 구조나 반복되는 부분도 정밀하게 분석할 수 있다. 이 기술은 특히 희귀질환 진단이나 암 유전체 해석처럼 높은 정확도가 필요한 분야에서 활용이 빠르게 늘고 있다. 우리는 PacBio 등 세계적인 분석 플랫폼 기업의 기술을 도입해 정밀 분석에 활용하고 있다. 또한 single-cell sequencing은 말 그대로 개별 세포 하나하나의 유전정보를 분석하는 기술로, 암 조직 속 다양한 세포들의 특성을 파악하거나 면역세포의 구성, 세포 발달 단계를 추적하는 데 효과적이다. 마크로젠은 10x Genomics 등과 협력해 단일세포 전사체 분석(scRNA-seq), ATAC-seq, 공간 전사체 분석 등 다양한 서비스를 제공한다.한 최신 기술을 바탕으로 단순히 유전자 정보를 제공하는 것을 넘어, 세포 수준에서 생물학적 특징을 분석하고, 치료 효과를 예측하거나 신약 후보를 찾는 데까지 분석 범위를 넓히고 있다. 또한 병원, 연구기관과 함께 임상 연구도 꾸준히 확대해 나가고 있다.”
- 최근 ‘국가 통합 바이오 빅데이터 구축 사업’ 주사업자로 선정됐다. 이 프로젝트에서 어떤 역할을 할 것인가.
“이번 사업에서 우리는 최종 사업자로 선정된 컨소시엄의 주관사로 참여한다. 총 14만 5952건의 인간 전장 유전체(WGS) 데이터와 2800건의 전사체(mRNA) 데이터를 생산하고 분석하는 핵심 역할을 맡고 있다. 대규모 데이터 생산과 품질 관리, 보안과 기술 운영 등 여러 측면에서 우리가 보유한 기술력과 인프라가 높게 평가된 결과라고 생각한다. 이 사업을 통해 한국인에게 취약한 질병을 사전에 예측하고 진단할 수 있는 기반을 마련하고, 미래 정밀의료 서비스 개발은 물론 바이오헬스 산업의 전반적인 경쟁력 강화에도 기여할 수 있을 것으로 기대한다.”
- 마크로젠이 보유한 유전체 데이터의 범위와 규모는 어느 정도인가. 이를 통해 어떤 질병 분야에서의 혁신이 가능하다고 보나.
“마크로젠은 현재 세계적으로도 수준 높은 유전체 및 오믹스 데이터를 보유하고 있다. 특히 한국과 아시아 인구를 기반으로 한 희귀 유전 변이나 특정 질환과 관련된 특징 같은 고유한 정보를 많이 가지고 있다. 대표 사례로 2019년 세계적인 과학 저널 네이처에 소개된 연구가 있다. 우리는 ‘게놈아시아 100K’라는 다국적 프로젝트에 주도적으로 참여해 한국인을 포함한 아시아 각국 사람들의 유전체 다양성을 정밀 분석했다. 그 결과 하나의 사례로 심혈관 질환 치료에 쓰이는 특정 항응고제에 대해 한국인, 중국인, 일본인 같은 북동아시아 사람들이 유전적으로 더 민감하게 반응할 수 있다는 점을 밝혀냈다. 이러한 정보는 약물 부작용을 미리 예측하거나, 사람마다 다른 맞춤형 처방을 하는 데 활용할 수 있다. 마크로젠은 우리가 보유한 데이터를 바탕으로 희귀질환 조기 진단, 암 맞춤 치료, 정신질환이나 자폐증 등 복합질환의 유전 위험 예측, 약물 반응성 기반의 개인별 맞춤 처방 등 다양한 질병 분야에서 새로운 해결책을 제시하고 있다. 앞으로도 국내외 병원 및 연구기관들과 협력하면서, 유전체 정보를 실제 의료 현장에서 더 널리 활용할 수 있도록 하고, 한국과 아시아인의 건강을 지키는 정밀의료 생태계를 주도해 나갈 계획이다.”
- 한국과 아시아 데이터가 많다면, 유전체 데이터 편향 문제를 극복하는데 도움이 될 것 같다.
“현재 유전체 연구 분야에서 가장 크게 지적되고 있는 문제 중 하나는 인종적 다양성의 부족이다. 지금까지 생산된 대부분 유전체 데이터는 백인(Caucasian) 중심으로 이뤄져 있다. 이러한 불균형은 유전자 기반 예측 모델의 편향에도 직접적인 영향을 미친다. 우리는 이러한 문제를 풀기 위해 앞서 언급한 '게놈아시아 100K'와 같은 아시아 중심의 컨소시엄을 설립하거나, NARD(Northeast Asian Reference Database)와 같은 동아시아인 참조 데이터베이스를 자체적으로 구축하고 있다. 또한, 젠톡(GenTok)과 같은 DTC(Direct-to-Consumer) 플랫폼을 통해 일반인 유전체 데이터도 확보함으로써 아시아인의 대표성을 높이고, 학습 데이터의 다양성과 편향 문제를 해결하고자 지속적으로 노력하고 있다. 2016년에는 네이처 논문 발표를 통해 당시 가장 정밀한 한국인 표준 게놈(AK1)을 구축했다. 이는 기존 백인 중심 유전체 표준에서 벗어나 한국인 고유의 게놈 참조 정보를 확보했다는 점에서 의미가 크며, 예측 모델의 비백인 대상 정확도를 평가하는 데에도 도움이 되고 있다.”
- 유전체 분석을 통한 희귀질환 조기 진단 및 발병 예측 분야에서 마크로젠의 경쟁력은.
“마크로젠은 유전체 분석을 기반으로 한 희귀질환 조기 진단과 발병 예측 분야에서 약 30년 가까운 경험과 기술력을 가진 선도 기업이다. 특히, 희귀 유전질환과 관련된 방대한 유전자 변이 데이터베이스(DB)와 이를 활용한 정밀한 변이 분석 기술은 진단 정확도와 속도 면에서 세계 최고 수준의 경쟁력을 갖추고 있다. 우리는 지금까지 축적한 수십만 건의 유전체 데이터와 임상 정보를 통합해, 환자별 맞춤 해석이 가능한 알고리즘을 지속적으로 고도화해왔다. 또한 국내외 병원, 연구기관들과 협력해 실제 임상에서 활용 가능한 희귀질환 진단 솔루션을 지속적으로 확대하고 있으며, 정밀의료 실현을 위한 다양한 공동 프로젝트도 추진하고 있다.”
- 마크로젠의 R&D 전략에서 ‘정밀의료’는 어떤 방식으로 구현되나.
“개인별로 건강을 관리하고 질병을 예방할 수 있는 정밀 의료를 실현하기 위해, 유전체 분석을 바탕으로 다양한 맞춤형 서비스를 제공한다. 암, 당뇨병, 심혈관질환, 치매 등 주요 질환에 대해 발병 가능성을 미리 예측하고, 발병 전에 생활습관을 조정하거나 조기 관리할 수 있도록 돕는 것이 핵심이다. 또한, 특정 약물에 유전적으로 어떻게 반응할지, 어떤 생활습관이 질병 위험에 영향을 줄 수 있는지 등에 대한 인사이트도 함께 제공하고자 한다. 이를 통해 더 개인화된 건강관리와 예방 중심의 의료 서비스를 구현하고 있다.”
- 마크로젠의 유전체 분석 과정에 AI 기술은 어떻게 접목되고 있나.
“우리는 지금까지 수십만 건의 유전체 분석 의뢰를 처리한 경험을 바탕으로, DNA와 RNA 샘플의 품질 데이터를 체계적으로 쌓아왔다. 특히, 유전체 분석 실험(NGS) 전에 필요한 샘플 품질 검사(QC)와 라이브러리 단계 품질 데이터를 활용해, 자체 개발한 AI 모델로 실험 실패 가능성을 예측하고 있다. 실패 확률이 높은 샘플은 사전에 걸러내기 때문에, 시간과 비용을 줄이고 전체 실험의 효율도 높일 수 있다. 또한 실험 성공률을 높이기 위해, 고객 정보와 실험 데이터를 AI가 분석해 실험자나 분석 담당자가 빠르게 대응할 수 있도록 돕는 LLM 기반 수주 통합 시스템도 구축해 활용 중이다. 이처럼 마크로젠은 유전체 분석 실험의 운영 전반에 AI 기술을 적극적으로 도입해 실험 정확도와 효율성을 높이고 있으며, 앞으로도 분석 과정의 자동화와 최적화를 위한 AI 활용을 지속적으로 확대해 나갈 계획이다.”
- 그렇다면 변이 예측, 진단 지원 등에서 어떤 AI 모델이나 프레임워크를 활용하나.
“전장유전체 시퀀싱(WGS) 데이터 분석에는 구글이 개발한 딥러닝 기반 도구 DeepVariant를 도입해 분석 정확도를 높이고 있다. 이 도구는 유전체 시퀀싱 데이터를 이미지처럼 변환한 후, 딥러닝 모델을 통해 변이를 검출하는 방식으로, 기존의 통계적 방법보다 훨씬 높은 정확도와 일관된 성능을 보여준다. 특히 다양한 시퀀싱 플랫폼과 복잡한 유전체 영역에서도 정밀한 변이 해석이 가능하다는 강점이 있다. 또한 약물유전체(pharmacogenomics) 분석 분야에서는 머신러닝 기반 분석 도구인 PyPGx를 활용한다. 이 도구는 약물 반응에 영향을 주는 주요 유전자들—특히 구조가 복잡한 CYP2D6이나 CYP2C19에 대해 정밀한 유전자형(genotype)과 복제수 변이(CNV) 분석이 가능하며, 개인의 약물 반응성을 더 정확하게 예측할 수 있게 해준다. 마크로젠은 이러한 AI 도구들을 기반으로 변이 해석의 정확도와 신뢰도를 높이고 있으며, 이를 통해 개인 맞춤형 진단과 정밀의료 서비스의 질적 향상을 이끌고 있다.”
- 생성형 AI를 적용한 사례도 있나.
“일반 소비자를 대상으로 한 DTC(Direct-to-Consumer) 유전자 검사 서비스인 ‘젠톡(GenTok)’을 운영하고 있다. 이 서비스에는 유전자 상담 챗봇인 ‘젠톡 AI’가 포함돼 있어, 고객들은 유전자 검사 결과에 대해 궁금한 점을 연중무휴 24시간 언제든지 질문할 수 있다. 젠톡 AI는 챗GPT 모델과 RAG(Retrieval-Augmented Generation) 기술을 기반으로 작동하며, 200장이 넘는 유전자 검사 리포트를 참고해 고객에게 개인 맞춤형 답변을 제공한다. 또 우리는 영업 측면에서도 수십만 건에 달하는 수주 데이터(LIMS)를 분석하고 있으며, 이를 통해 신규 고객 타겟 설정 및 프로모션 전략 수립에 활용하고 있다. LIMS 데이터를 챗GPT 모델과 결합해 현재 수주 현황, 어플리케이션 트렌드, 신규 고객 발굴 가능성을 종합적으로 분석하는 모델을 개발해 실제로 운영 중이다. 이 외에도, 운영 부문에서는 복잡한 로직이 필요한 업무를 자동화하기 위해 LLM을 활용하는 사례도 늘어나고 있다.”
- 유전체 데이터는 방대하다. 마크로젠만의 데이터 전처리 및 학습 최적화 기술이 있다면.
“유전체 데이터는 양도 방대하고 구조도 매우 복잡하기 때문에, 이를 정확하고 효율적으로 분석하기 위해서는 정교한 전처리와 분석 최적화가 필수다. 마크로젠은 임상 진단 과정에서 수많이 발견되는 유전자 변이 중에서, 실제 생물학적으로 의미 있는 변이와 실험 과정에서 생긴 오류(artifact)를 구분하는 데 중점을 두고 있다. 특히, 자체적으로 축적한 한국인 유전체 데이터를 기반으로, 한국인에게 자주 나타나는 오류 유형을 미리 정리해두고 이를 분석 과정에 활용한다. 이러한 데이터는 변이 필터링 단계에서 불필요한 오탐지(false positive)를 줄이는 데 큰 역할을 한다. 또한 마크로젠은 머신러닝 기반 품질 평가 알고리즘을 분석 파이프라인에 적용해, 시퀀싱 과정에서 발생할 수 있는 오류 패턴을 자동으로 식별하고 빠르게 제거할 수 있도록 시스템을 최적화했다. 이를 통해 분석의 민감도와 특이도를 동시에 높이며, 임상적으로 의미 있는 결과를 더 빠르게 도출할 수 있다.”
- 최근 글로벌 유전체 분석 시장의 경쟁이 심화하고 있다. 마크로젠의 경쟁력은 무엇이라고 보나.
“최근 글로벌 제약사들, 특히 다국적 제약사(Pharma)들이 아시아 시장에 큰 관심을 보이고 있다. 코로나19 이후 이러한 흐름은 더욱 뚜렷해졌다. 이는 지금까지 신약 개발의 기반이 대부분 비(非)아시아인 유전체 데이터에 의존했기 때문이다. 앞으로는 아시아인의 유전적 특성을 반영한 데이터가 신약 개발과 정밀의료가 발전할 것으로 본다. 여기서 중요한 경쟁 요소는 아시아인 유전체 데이터의 확보다. 앞서 언급한 것처럼, 현재 글로벌 유전체 데이터는 백인 중심으로 구성돼 있어 다양성과 대표성에 한계가 있다. 따라서 누가 더 풍부하고 신뢰도 높은 아시아인 유전체 데이터를 확보하고 있느냐가 곧 글로벌 경쟁력을 좌우하게 될 것이다. 이런 측면에서 볼 때, 마크로젠이 축적해온 고품질의 아시아인 유전체 데이터는 명확한 차별점이다. 특히 한국인을 포함한 동아시아인의 유전적 특성을 기반으로 AI 분석 모델의 정확도와 신뢰성을 높일 수 있다는 점에서, 이는 단순한 데이터 확보를 넘어, 정밀의료 시장 선도를 위한 핵심 자산이 된다.”
- 글로벌 유전체 플랫폼 구축이나 클라우드 기반 분석 시스템에서 AI와 보안 문제는 어떻게 조율하고 있나.
“유전체 데이터는 민감한 개인정보에 해당하기 때문에, 무엇보다 보안을 최우선 과제로 두고 철저하게 관리하고 있다. 최근에는 연구기관뿐 아니라, 일반 소비자를 대상으로 한 젠톡 유전자 검사 서비스까지 포함되면서 보안에 대한 책임이 더욱 커졌다. 이를 위해 우리는 글로벌 보안 표준인 ISMS-P와 ISO 인증을 취득했고, 그 외에도 추가적인 보안 설계를 도입해 데이터 보호 수준을 지속적으로 강화해 왔다. 이러한 노력 덕분에 정부 주도의 ‘국가 통합 바이오 빅데이터 구축 사업’과 같은 대형 프로젝트에서도 신뢰를 얻고 주요 사업자로 선정될 수 있었다고 생각한다. 분석 시스템 측면에서는 클라우드의 중요성이 점점 커지고 있다. 마크로젠은 기존의 온프레미스 환경과 클라우드를 결합한 하이브리드 인프라를 운영하고 있으며, 클라우드 역시 보안성과 안정성을 최우선으로 고려해 설계하고 있다. AI 분석 기능 역시 이런 보안 체계 안에서 안전하게 통합 운영되며, 민감한 유전체 정보가 외부에 노출되지 않도록 모든 단계에서 체계적인 보안 관리를 병행하고 있다. 마크로젠은 앞으로도 AI 기술의 활용과 보안 간 균형을 유지하면서, 글로벌 수준의 신뢰성과 효율성을 갖춘 유전체 분석 플랫폼을 지속적으로 고도화해 나갈 계획이다.”
- 유전체 기반 건강 관리가 추후 맞춤형 식단, 운동, 복약지도 서비스까지 확장될 가능성이 있을까. 관련 사업을 준비하는 곳들이 있는 것으로 안다.
“맞춤형 건강관리 서비스는 유전체 분석의 주요 응용 분야다. 마크로젠도 다양한 기업간거래(B2B) 연계 서비스를 통해 이를 적극 제공하고 있다. 맞춤형 식단, 건강기능식품, 화장품, 피트니스 등 다양한 디지털 헬스케어 플랫폼과의 연계를 추진하고 있다.”
- AI 기술이 유전체 분석의 패러다임을 어떻게 바꾸고 있다고 보나. 미래엔 어떤 변화가 생길지도 궁금하다.
“인간의 유전자는 약 30억 개의 염기쌍으로 이뤄져 있고, 우리는 오랫동안 유전자 변이와 다양한 오믹스 데이터를 바탕으로 이 정보가 건강에 어떤 영향을 미치는지 분석해 왔다. 하지만 그 양과 복잡성이 워낙 방대해, 일종의 거대한 퍼즐을 한 조각씩 맞추는 작업처럼 느리게 진행될 수밖에 없었다. 이제는 AI 기술의 발전 덕분에, 과거에는 하나씩 맞춰야 했던 퍼즐을 이제는 동시에 수십 개씩 연결할 수 있게 됐고, 이를 통해 전체 유전체의 패턴을 더 빠르고 정확하게 파악할 수 있게 됐다. 이러한 기술 진보는 새로운 유전자 발견과 질병 연관성 규명을 크게 앞당길 것으로 기대된다. 과거에는 유전체 정보가 전문 연구자들만 다루는 어렵고 먼 영역으로 여겨졌지만, 앞으로는 혈당이나 혈압처럼 누구나 일상적으로 관리하고 활용할 수 있는 정보가 될 가능성이 높다. 많은 사람들이 자신의 유전체 정보를 직접 확인하고, 이를 바탕으로 생활습관을 조절하거나 건강 관리를 실천하는 시대가 머지않았다고 생각한다.”
- 유전체 분석 기반 건강 관리가 가져올 긍정 효과는.
“유전체 분석을 기반으로 한 건강 관리는 단순히 질병을 미리 막는 수준을 넘어, 국민 전체의 삶의 질 향상과 의료비 절감이라는 사회적 효과까지 기대할 수 있는 중요한 변화다. 일례로 암이나 심혈관 질환처럼 치료 비용과 사망률이 높은 질환에 대해 조기에 위험을 예측하고, 그 전에 예방적 개입이 가능해지면 질병의 진행 자체를 막을 수 있다. 이 과정에서 과잉진단이나 과잉처방 같은 기존의 사후 중심 의료 문제도 줄어들게 된다. 결과적으로 개인의 건강을 지키는 데 그치지 않고, 국가 의료 체계의 지속 가능성을 높이고 사회 전체의 건강 부담을 줄이는 데에도 크게 기여할 수 있다고 생각한다.”
- 마크로젠의 향후 계획은.
“우리는 유전체 분석 기술의 대중화와 빅데이터·AI 기반의 정밀의학 실현을 통해 인류의 무병장수와 건강한 삶에 기여하고자 노력하고 있다. 유전정보를 분석하는 수준을 넘어, 축적된 유전체 데이터를 기반으로 질병의 발생 위험을 예측하고, 개인별 맞춤형 건강관리 솔루션을 제시함으로써 정밀의학의 실질적인 가치를 전달하는 것을 목표로 한다. 앞으로 유전체 분석 기업을 넘어, 데이터를 기반으로 실질적인 건강 인사이트와 예방 중심의 의료 전략을 제공하는 ‘정밀의학 정보 기업’으로 자리매김하겠다. 이를 통해 보다 많은 사람들이 자신의 유전체 정보를 이해하고, 스스로 건강을 관리할 수 있는 환경을 조성함으로써 의료의 민주화에 기여할 계획이다.”