최종편집:2025-11-26 07:49 (수)
실시간
KAIST, 그래프 AI 학습 속도 95배 높인 기술 개발

KAIST, 그래프 AI 학습 속도 95배 높인 기술 개발

  • 기자명 구아현 기자
  • 입력 2025.08.13 16:17
  • 0
  • 본문 글씨 키우기
이 기사를 공유합니다
(왼쪽부터) 한동형 그래파이 CTO, 배정민 박사과정, 김민수 교수
(왼쪽부터) 한동형 그래파이 CTO, 배정민 KAIST 전산학부 박사과정, 김민수 배정민 KAIST 전산학부 교수. /KAIST

KAIST 연구진이 단 한 대의 그래픽처리장치(GPU) 서버만으로도 대규모 그래프 인공지능(AI) 모델을 최고속 학습할 수 있는 성능의 소프트웨어(SW) 기술 개발에 성공했다고 13일 밝혔다.

KAIST는 김민수 전산학부 교수 연구팀이 여러 대의 GPU 서버를 활용하는 기존 방식과 달리 한 대의 GPU 서버에서 대규모 풀(full) 그래프 AI 모델을 빠르게 학습하고 추론할 수 있는 그래프신경망(GNN) 시스템 ‘FlexGNN(플렉스지엔엔)’을 개발했다고 발표했다. FlexGNN은 기존 기술 대비 학습 속도를 최대 95배 향상시켰다.

텍스트 기반 대형언어모델(LLM)인 챗GPT와 함께 산업 현장에서는 금융 거래, 주식, 소셜미디어(SNS), 환자기록 등 비정형 데이터를 그래프 형태로 분석하는 GNN 기반의 그래프 AI 모델이 적극 활용되고 있다.

최근 기후, 금융, 의료, 제약, 제조, 유통 등 다양한 분야에서 데이터를 정점과 간선으로 구성된 그래프 형태로 변환해 분석 및 예측하는 사례가 증가하고 있다.

전체 그래프를 모두 학습에 활용하는 풀 그래프 방식이 더욱 우수한 정확도를 보이지만, 학습 과정에서 대규모의 중간 데이터가 발생해 메모리 부족 현상이 빈번히 발생하고 여러 서버 간의 데이터 통신으로 인해 학습 시간이 길어지는 한계가 있었다.

연구팀이 개발한 FlexGNN은 이러한 문제를 극복하기 위해 여러 대의 GPU 서버 대신 단일 GPU 서버에서 SSD(솔리드 스테이트 드라이브)와 메인 메모리를 활용한 최적의 AI 모델 학습을 수행한다.

특히 데이터베이스 시스템의 질을 최적화시키는 AI 쿼리 최적화 학습을 통해 GPU-메인 메모리-SSD 계층 간 모델 파라미터, 학습 데이터, 중간 데이터를 최적의 시점과 방식으로 계산시키는 새로운 학습 최적화 기술을 개발했다.

이를 통해 FlexGNN은 데이터 크기, 모델 규모, GPU 메모리 등 가용 자원 상황에 따라 유연하게 최적의 학습 실행 계획을 생성해 높은 자원 효율성과 학습 속도를 구현했다.

그 결과 메인 메모리 용량을 훨씬 초과하는 데이터에 대해서도 GNN 모델을 학습할 수 있게 됐고, 단일 GPU 서버에서도 최대 95배 빠르게 학습이 가능해졌다. 특히 기후 예측 등에서 슈퍼컴퓨터보다 정밀한 분석이 가능한 풀 그래프 AI 구현이 현실화됐다.

김민수 KAIST교수는 “날씨 예측과 신소재 발견 등 복잡한 문제를 해결하는데 풀 그래프 GNN 모델이 활발히 활용되면서 관련 기술의 중요성이 점점 높아지고 있다”며 “FlexGNN이 그동안 어려움으로 남아 있던 그래프 AI 모델의 학습 규모와 속도 문제를 획기적으로 해결한 만큼, 다양한 산업 분야에 널리 활용되기를 기대한다”고 전했다.

연구 결과는 세계적 권위의 데이터마이닝 학술대회인 ‘ACM KDD’에서 지난 5일 발표됐다. FlexGNN 기술은 향후 그래파이의 그래프 DB 솔루션인 그래프온(GraphOn)에도 적용될 예정이다.

저작권자 © THE AI 무단전재 및 재배포 금지
관련기사
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
모바일버전