최종편집:2025-11-26 07:49 (수)
실시간
UNIST, 멀티모달 학습법 개발… “데이터 정렬 없어도 돼”

UNIST, 멀티모달 학습법 개발… “데이터 정렬 없어도 돼”

  • 기자명 구아현 기자
  • 입력 2025.05.07 18:08
  • 수정 2025.05.07 18:23
  • 0
  • 본문 글씨 키우기
이 기사를 공유합니다
이재준 UNSIT 연구원(왼쪽)과 윤성환 UNSIT 교수. /UNSIT
이재준 UNSIT 연구원(왼쪽)과 윤성환 UNSIT 교수. /UNSIT

서로 다른 유형의 데이터 학습에서 필요하다고 여겨지던 데이터 정렬 작업 없이 인공지능(AI)에게 한 유형의 데이터만 가르쳐서 다른 유형의 데이터 학습을 촉진 시킬 수 있는 학습 방식이 개발됐다.

UNIST(울산과학기술원)은 윤성환 인공지능대학원 교수팀이 데이터 정렬과 매칭 없이 하나의 데이터 유형만으로 다른 유형의 모델 학습을 촉진 시킬 수 있는 AI 멀티모달 학습 기술을 개발했다고 7일 밝혔다.

멀티모달 학습은 오디오, 이미지, 텍스트와 같이 서로 다른 데이터 모달리티를 결합해 통합적으로 이해하고 처리하는 학습법이다. 멀티 모달 학습을 위해서는 다양한 모달리티 데이터를 정렬하고 이에 대해 쌍을 이루는 라벨링 과정이 필요해 많은 시간과 비용이 소모된다. 명확히 짝지어진 데이터가 부족하면 성능이 저하되기도 한다.

연구팀이 제안한 학습법은 짝지어지지 않은 데이터로도 멀티 모달 학습이 가능하다.

연구팀은 텍스트 모델이 이미지 모델 학습을 돕거나 오디오 모델이 언어 모델 성능을 높이는 실험에서 기존보다 높은 정확도를 기록하며 모달리티 간 학습 촉진 효과를 확인했다.

특히 오디오와 이미지처럼 직접적인 연관성이 적은 조합에서도 AI의 성능 향상이 나타났다.

이재준 UNIST 연구원은 “서로 관련 없어 보이는 오디오와 이미지 조합에서도 성능이 향상된 것은 기존 멀티모달 학습 방식에 대한 고정관념을 깨는 흥미로운 결과”라고 설명했다.

윤성환 UNIST 교수는 “정렬된 데이터셋 확보가 어려운 의료, 자율주행, 스마트 AI 비서 등 다양한 분야에서 활용 가능성이 높다”고 말했다.

연구 결과는 세계 3대 AI 학회인 ‘ICLR(International Conference on Learning Representations) 2025’에서 발표됐다.

저작권자 © THE AI 무단전재 및 재배포 금지
관련기사
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
모바일버전