최종편집:2025-11-26 07:49 (수)
실시간
KAIST, 멀티모달 AI 성능 높이는 학습 데이터 증강 기술 개발

KAIST, 멀티모달 AI 성능 높이는 학습 데이터 증강 기술 개발

  • 기자명 구아현 기자
  • 입력 2025.10.14 14:14
  • 수정 2025.10.14 17:57
  • 0
  • 본문 글씨 키우기
이 기사를 공유합니다

황의종 전기및전자공학부 교수팀
AI가 영상, 데이터, 음성 등 데이터 불균형 문제 완화

(왼쪽부터) 최소영 KAIST 전기및전자공학부 석사과정, 황성현 KAIST 박사과정, 황의종 KAIST 교수(오른쪽위). /KAIST
(왼쪽부터) 최소영 KAIST 전기및전자공학부 석사과정, 황성현 KAIST 박사과정, 황의종 KAIST 교수(오른쪽위). /KAIST

KAIST 연구진이 그림과 글자를 모두 고르게 인식해 멀티모달 인공지능(AI)의 성능을 높일 수 있는 학습기법을 개발했다.

KAIST는 황의종 전기및전자공학부 교수 연구팀이 다양한 데이터 유형을 한 번에 처리해야 하는 멀티모달 AI가 모든 데이터를 고르게 활용할 수 있도록 돕는 새로운 학습 데이터 증강 기술을 개발했다고 14일 밝혔다.

멀티모달 AI는 텍스트, 영상 등 다양한 유형의 데이터를 학습해 이를 이해하고 판단할 수 있다. 다만 AI는 여러 정보를 받아들일 때, 한쪽 데이터에 치우쳐 판단하는 경향을 보여 예측 성능이 떨어지는 문제가 있어왔다.

연구팀은 이 문제를 해결하기 위해, 일부러 서로 어울리지 않는 데이터를 섞어서 학습에 사용했다. 그러면 AI는 어떤 경우에도 한쪽 데이터에만 의존하지 않고, 글과 그림, 소리 등 모든 데이터를 균형 있게 활용하는 방법을 배우게 된다.

또, 품질이 낮은 데이터는 보완하고, 어려운 데이터는 더 강조해서 훈련하는 방식까지 더해 다양한 상황에서도 안정적으로 성능을 높일 수 있음을 보여줬다. 이 방법은 특별한 모델 구조에 묶이지 않고, 어떤 종류의 데이터에도 쉽게 적용할 수 있어 확장성과 실용성이 크다는 점에서 의미가 있다.

황의종 KAIST 교수는 “AI 성능을 높이려면 모델 구조(알고리즘)만 바꾸는 것보다, 어떤 데이터를 어떻게 학습에 쓰느냐가 훨씬 중요하다”며 “이번 연구는 멀티모달 AI의 특정 데이터에 치우치지 않고 균형 있게 정보를 활용할 수 있도록 데이터 자체를 설계하고 가공하는 접근법이 효과적일 수 있음을 보여줬다”고 말했다.

연구 결과는 오는 12월 미국 샌디에이고와 멕시코 멕시코시티에서 열리는 AI 분야 최고 권위 국제학술대회 신경정보처리시스템학회(NeurIPS)에서 발표될 예정이다.

저작권자 © THE AI 무단전재 및 재배포 금지
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
모바일버전